我有PDF文件已经被“识别”使用OCR文本识别->识别文本使用功能在Acrobat。
我想把这些作为一个上传(C# ASP.NET MVC),并能够提取这些信息用于索引和搜索目的。
我尝试打开PDF文件,但没有找到任何被识别的文本,所以我猜它是压缩和/或编码的。
有什么想法吗?
发布于 2010-06-25 06:17:32
pdftotext
https://stackoverflow.com/questions/3115884
相似问题