目前,我正在尝试为iPhone创建一个应用程序,它能够识别图像上的对象,如汽车,公交车,建筑物,桥梁,人等,并在互联网的帮助下标记为对象名称。
有没有免费的服务可以解决我的问题,因为物体识别本身就是一个复杂的算法,需要数字图像处理,神经网络等等。
这可以通过API实现吗?
发布于 2012-01-02 20:46:59
如果你想识别平面图像,Metaio,Qualcomm和Layar的当前一代移动AR SDK将允许你上传图像进行匹配,并执行匹配。
如果你想自由地匹配一组3D对象,例如一辆丰田普锐斯或帝国大厦,可以应用相同的技术来匹配在不同旋转角度拍摄的图像集,但由于服务可以拥有的图像数据库有多大的限制,您可能不得不选择只匹配一个对象,或者联系这些公司寻求自定义解决方案,考虑到目前的技术水平是可靠地匹配平面图像,它可能不太可靠。
如果你想识别一般的类(人类,汽车,建筑),这是一个非常困难的问题,我不知道有什么解决方案足够快,可以在线操作(我假设这是一个要求,因为你想要一个AR解决方案-这是一个公平的假设吗?)我研究CV已经有几年了,但当时最有希望的视觉分类解决方案是“视觉单词袋”方法-你可以尝试阅读这些方法。
发布于 2012-01-01 22:25:49
看看Cortexica。对这类事情非常有用。
https://stackoverflow.com/questions/8693387
复制相似问题