我正在使用命令提示符在windows 11上运行tesseract。
文本文件是我的培训数据。我想把这些词变成图像。输出是Tesseract过程中用于训练我的字体的下一步。我是说查找字体,但我在文件夹中只有一种字体。
--text="C:\PythonProjects\DiabloTesseractTrainFont\text.txt“--outputbase="C:\PythonProjects\DiabloTesseractTrainFont\Output\Dia.font.exp0”--fontconfig_tmpdir="C:\PythonProjects\DiabloTesseractTrainFont“--查找字体--fonts_dir="C:\PythonProjects\DiabloTesseractTrainFont\Diablo字体”
结果:总字符= 223645字体Exocet失败,223518次点击= 99.94%
不知道为什么会失败。我以前做过类似的东西。我尝试了一个字体文件,我知道它是有效的,它做了完全相同的事情。
任何帮助都将不胜感激。
发布于 2022-02-12 23:07:24
我解决了。在文本文件中,当我将一些字符读入python时,它们发生了一些变化。我相信它们曾经是要点,但是当我读到文件时,我用python编码实现了,忽略了错误。我以为这些角色会被移除。我错了。用上面写着的文字代替了这些要点。我在notepad++中找到了它,突出了其中的一个,然后用一个空格替换了它们。注意,在Notepad++中,当我进行替换时,它在find字段中没有任何内容,但是它仍然替换了所有这些。现在它编译得很好。我被困了好几个小时我希望这能帮上忙。
https://stackoverflow.com/questions/71094757
复制相似问题