在过去的10天里,我刚刚开始使用Ubuntu,打算永久停止使用Windows。到目前为止已经很棒了。我已经用可用的Ubuntu应用程序和Google的一些帮助替换了几乎所有的Microsoft应用程序。
我的佳能CanoScan LiDE 110扫描仪出了问题。当我使用Windows 7中的扫描仪,并将扫描过的书籍页保存为PDF格式时,我可以打开PDF扫描页面并直接从其中复制文本以粘贴到Google或任何LibreOffice文档。我尝试在Ubuntu中使用简单的扫描应用程序进行同样的操作。我通过简单的扫描将页面扫描为文本,并将其保存为PDF格式。但是在Ubuntu中,当我打开扫描的PDF页面时,它会打开OK,但是我不能复制文本。
这对我的工作流程非常重要,因为我是一名内科医生,我需要学习很多书。
如果你能帮我这个忙,我会很感激的。
发布于 2014-03-16 05:51:38
Tesseract在1995年是排名前三的OCR之一。自2006年以来,google一直在进行这项开发,它可以扫描图像,转换为文本,识别40种语言。
安装Tesseract
sudo apt-get install tesseract-ocr楔形文字是另一个system.It识别23种语言,其中包括英语,德语,俄语,法语等。
安装Cuneiform
sudo apt-get install cuneiform应用程序
https://askubuntu.com/questions/434862
复制相似问题