我下载了OCR项目,但是我有一个关于EverNote特性的问题。使用他们的光学字符识别服务,我可以拍照并将提取的文本显示在UILabel中,还是不能这样工作?或者提取的文本不会显示给我,而只是用于照片的搜索功能?
有没有人对此或任何想法有过任何经验?
谢谢!
发布于 2011-11-13 06:38:13
是的,但看起来还需要做些工作。
当您获得与图像相对应的EDAMResource时,它有一个名为recognition的属性,该属性返回一个EDAMData对象,该对象包含定义识别信息的XML。例如,我将此图像附加到便笺中:

我检查了附加到相应EDAMResource对象的recognition信息,发现了以下内容:
the xml i found on pastie.org, because it's too big to fit in an answer
如您所见,这里有很多信息。XML是在the API documentation中定义的,因此您可以在这里解析XML并自己提取相关信息。幸运的是,XML的结构非常简单(您可以在几分钟内编写一个解析器)。最困难的部分是找出你想要使用的部分。
发布于 2015-04-25 08:02:27
它并不是这样工作的。Evernote并不是真正的将文档图像转换为连贯的文本段落的纯意义上的"OCR“。
Evernote的recognition XML (你可以通过@DaveDeLong上面展示的技术检索到)作为索引进行搜索是最有用的;该服务将为你提供一组矩形和一组可能的单词/文本片段,并附上概率分数。这为匹配搜索词提供了一个很好的基础,但对于构造表示文档的单个字符串来说却是一个糟糕的基础。
(我知道这个答案可能晚了4年,但Dave的精彩描述并没有真正解决这个哲学上的区别,如果你试图实际做你在问题中建议的事情,你将会遇到这种哲学上的区别。)
https://stackoverflow.com/questions/8107830
复制相似问题