文章/答案/技术大牛

发布

社区首页 >问答首页 >在使用pytesseract提高结果时，如何设置配置load_system_dawg？

问在使用pytesseract提高结果时，如何设置配置load_system_dawg？
EN

Stack Overflow用户

提问于 2019-08-11 22:44:22

回答 1查看 1.1K关注 0票数 5

我试图通过使用pytesseract配置更改params来改进结果。我想知道是否有可能改变load_system_dawg和load_freq_dawg，就像https://github.com/tesseract-ocr/tesseract/wiki/ImproveQuality#page-segmentation-method中指定的那样，因为我想得到的单词不是真正的英语，而是像XYZ ###和其他一些独特的字母序列。见截图

我可以调整--psm的配置，但如果我尝试-load_system_dawg 0，则不会得到这样的命令行参数或不存在的文件的错误。我不知道，似乎值得一试.

params = r'--psm 11'
string = pytesseract.image_to_string(img, config = params)

我假设没有办法通过python做到这一点，但是如果我能够被指导如何修改它，我会很感激的，因为我对C++的了解并不多。这个改变会通过pytesseract初始化吗？此外，我还尝试过更改用户模式，但不确定这是否是更好的方法。

tesseract

python-tesseract

python

ocr

回答 1

Stack Overflow用户

发布于 2021-03-24 18:02:06

你需要知道以下几点：

例如，如果应用阈值图像，则会变成：

下一步应用bitwise_not

现在，如果您阅读(假设图像是一个单一的统一文本块)：

Hinecratt 1.14.4 1.14.4 / vanilla Javea: 136 51 64bit
68 fps (8 chunk updates) T: inf vsune fancy-clouds veo Hem: 4ah 8757 2648NE
Integrated server @ 11 ms ticks, 13 tx, 735 rx Allocated: 814% 1664M6
C: 1615376 (5) 0: 15, pC: G66, pu: 6, ab: Se
c afte oe CPU: 16% AND Fiyzen 7 L786 ECight-Core Processor
Client Chunk Cache: 1659, 75 Display: 1926%1880 CHVIOIA Corporation?
ServerChunkCache: S734 GeForce OTA 1666 606/PCle/55E2
ninecrattoverworld FC: a 4.6.4 HVIDIA 431.68
42: S6L641 / 11.66668 ¢ 361.939 Targeted Block
Block: S61 11 361 Hinecrattiron_ore
Chunk: 13 11 3 in 18 @ 22
Facing: west (Towards negative 43 095.4 7 15.79 Targeted Fluid
Client Light: 11 (8 sky, 11 block? ninecrattempty
Server Light: (8 sky, 11 black?
CHS: 67 MH: 67
5H 3:67 0: 67 M: 67 ML: 67
Biome: minecrattdesert
Local Difficulty: 165 7/7 6.66 (Day 243
Looking at block: 295 16 361
Looking at liquid: 295 16 361
Sounds: 37247 + a7G
Debug: Pie Cehittl: hidden FPS + TPS Caltl: hidden
For hele: press Fa + oO

代码：

import cv2
import numpy as np
import pytesseract

# Load the image
img = cv2.imread("sPQDo1c.png")

# Convert to the HSV color-space
hsv = cv2.cvtColor(img, cv2.COLOR_BGR2HSV)

# Threshold
thr = cv2.inRange(hsv, np.array([0, 0, 214]), np.array([179, 0, 225]))

# Bitwise-not
bnt = cv2.bitwise_not(thr)

# OCR
print(pytesseract.image_to_string(bnt, config="--psm 6"))

# Display
cv2.imshow("", bnt)
cv2.waitKey(0)

我在使用pytesseract版本的0.3.7

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/57454134

复制

相似问题

问在使用pytesseract提高结果时，如何设置配置load_system_dawg？
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问在使用pytesseract提高结果时，如何设置配置load_system_dawg？EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问在使用pytesseract提高结果时，如何设置配置load_system_dawg？
EN