我需要从扫描的文档(pdf)中识别复杂的化学名称。它们包含特殊字符,并以表格格式写入。我还有一个Excel文档,其中包含我在扫描过程中可能遇到的所有可能的名称(我认为是行,因为没有组合)。有没有办法创建连字(这样Finereader就可以识别整行,而不是把它分解成单独的字符)?我尝试创建用户字典,但Finereader没有将其视为一行。
发布于 2017-05-03 12:24:22
创建连字的唯一方法是使用“用户模式训练”。在FineReader中,转到Tools -> Options -> Read选项卡(根据FR版本略有不同),并启用User pattern training。在训练过程中,扩展您的方框以包含几个组合字符,从而创建一个连字。
使用这种方法进行公式识别是困难的,但也是可能的。
我在www.wisetrend.com的工作中已经做过很多次了。我以前是ABBYY的支持员工,现在是集成商和OCR咨询专家。如果您需要更具体的帮助,我将很乐意帮助您。
https://stackoverflow.com/questions/43735989
复制相似问题