我有一篇法语论文,我试着读,为了更好地理解某些部分,我试图复制一些文本,并在谷歌翻译中使用,然而,如果我复制文本,我只是得到垃圾作为粘贴的文本。很可能编码有问题。更奇怪的是,我可以正确地复制文件第一页的文字--这也是法文的--但其他的,我只是从剪贴板上粘贴的文字中得到了一大堆垃圾字符。对如何阅读这篇论文的部分有什么想法吗?
发布于 2015-10-08 12:04:51
这涉及到pdf吗?
我尝试了一些东西,比如更改编码、转换和重新编码,但我认为您正处于描述这里的情况:
您最好的选择是将PDF保存为图像(TIFF或PNG),然后将它们组合在一起和OCR。
https://askubuntu.com/questions/221051
相似问题