我正在尝试使用Tesseract.js进行光学字符识别,但是我无法使用'preserve_interword_spaces‘选项。这是我正在尝试的:
Tesseract.recognize(
element.files[0],
'eng',
{ preserve_interword_spaces: 1,
logger: progress => {
console.log(progress);
progressBar.querySelector("div").innerText = progress.status;
progressBar.querySelector("progress").value = progress.progress;
} }
).then( //etc )OCR将多个空格合并为一个空格。帮助?
我更喜欢这样定义.recognize(),而不是使用await()。我知道preserve_interword_spaces是受支持的,因为我可以在文档here和here中看到它,但我不确定如何让它在我的例子中工作。
发布于 2020-07-28 04:28:05
这只是一个更新,我可以通过更改为async()来解决这个问题。正如documentation所说,Tesseract.recognize()只用于快速任务,而不是更复杂的任务。
https://stackoverflow.com/questions/63116173
复制相似问题