问在tesseract.js中使用'preserve_interword_spaces‘
EN

Stack Overflow用户

提问于 2020-07-27 21:17:15

回答 1查看 134关注 0票数 0

我正在尝试使用Tesseract.js进行光学字符识别，但是我无法使用'preserve_interword_spaces‘选项。这是我正在尝试的：

 Tesseract.recognize(
      element.files[0],
      'eng',
        { preserve_interword_spaces: 1,
          logger: progress => {
            console.log(progress);
            progressBar.querySelector("div").innerText = progress.status;
            progressBar.querySelector("progress").value = progress.progress;
        } }
    ).then( //etc )

OCR将多个空格合并为一个空格。帮助?

我更喜欢这样定义.recognize()，而不是使用await()。我知道preserve_interword_spaces是受支持的，因为我可以在文档here和here中看到它，但我不确定如何让它在我的例子中工作。

ocr

tesseract

tesseract.js

回答 1

Stack Overflow用户

发布于 2020-07-28 04:28:05

这只是一个更新，我可以通过更改为async()来解决这个问题。正如documentation所说，Tesseract.recognize()只用于快速任务，而不是更复杂的任务。

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/63116173

复制

相似问题

问在tesseract.js中使用'preserve_interword_spaces‘
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问在tesseract.js中使用'preserve_interword_spaces‘EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问在tesseract.js中使用'preserve_interword_spaces‘
EN