腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
搜索
关闭
文章
问答
(104)
视频
开发者手册
清单
用户
专栏
沙龙
全部问答
原创问答
Stack Exchange问答
更多筛选
回答情况:
全部
有回答
回答已采纳
提问时间:
不限
一周内
一月内
三月内
一年内
问题标签:
未找到与 相关的标签
筛选
重置
1
回答
Tesseract
hOCR
iOS
我正在学习如何使用Tesseract API,我对
hOCR
输出函数感兴趣。目前,我正在使用此代码扫描图像。-():" forKey:@"tessedit_char_whitelist"];一切都很好,但是我想知道
浏览 7
提问于2014-02-04
得票数 2
回答已采纳
0
回答
用Python将
hOCR
解析为JSON
我正在使用tesseract-ocr并获得
hOCR
格式的输出。我需要将这个
hOCR
输出存储到数据库中(在我的例子中是PostgreSQL)。既然我可能需要这个
hOCR
中的每一条信息(80% ),那么哪种方法是正确的呢?应该将其存储为XML数据类型还是解析为JSON并存储?在JSON的情况下,如何使用Python将此
hOCR
解析为JSON。
浏览 15
修改于2018-07-19
得票数 1
1
回答
如何从PDF中提取
hocr
文件?
我正在通过tesseract创建一个OCR编辑的PDF:但我也需要
hocr
和txt文件。我可以使用pdftotext提取文本文件,但我似乎找不到从PDF中提取
hocr
的方法。
浏览 0
修改于2016-04-19
得票数 6
回答已采纳
1
回答
Tesseract
hocr
字符输出
我正在使用Tesseract可移植版本3.02,并希望获得
hocr
输出的字符。问题是
hocr
输出只显示单词的购买框,而不显示字符,如果有人知道是否有一个选项可以更改tessdata/config,请告诉我。否则,让我知道,如果有另一种方法来解决这个问题。
浏览 1
提问于2015-11-11
得票数 1
回答已采纳
2
回答
将
hOCR
转换为HTML
我正在寻找一个在python中实现的工具或想法,它将
hOCR
文件(由应用程序在tesseract中生成)转换为html表。其思想是利用
hOCR
文件中的文本位置信息(在bbox属性中提供)来创建基于所提供位置的表。我举一个例子来解释上述观点: <div class='ocr_page' id='pa
浏览 5
修改于2017-03-15
得票数 12
1
回答
从tika-server获取
hocr
输出
在本例中,我使用的是X-Tika-OCRoutputType:
hocr
header,但是我获得了纯文本输出或没有
HOCR
标记的html输出。 -H "Content-Type: application/pdf" \ -H "X-Tika-OCRoutputType:
hocr
/tika-server:8081/
浏览 5
提问于2020-01-09
得票数 2
回答已采纳
1
回答
c#使用charlesw tesseract生成
hocr
文件
如何使用tesseract包装器生成
hocr
? string argsPdf = "\"" + inputImg + "\"" + " " + "\"" + hocrLocation + "\"" + "
hocr
如何使用包装器生成
hocr
文件?我找不到怎样
浏览 0
修改于2017-06-10
得票数 0
回答已采纳
3
回答
如何使用python-tesseract获取
Hocr
输出
因此,我决定检索
hocr
输出,而不是纯text.But;there似乎不是使用pytessearct指定配置文件的任何方式。那么,是否可以使用pytesseract指定cofiguration文件,或者是否有一些默认的配置文件可以更改以获得
hocr
输出?command += shlex.split(config) #command+=['C:\\Program Files (x86)\\Tesseract-OCR\\tessdata\\configs\\
hocr
浏览 4
提问于2015-12-13
得票数 5
3
回答
HOCR
转HTML以实现可视化
如果您打开原始
hOCR
文件,则其仅呈现为纯文本(元素未定位)
浏览 5
修改于2016-07-14
得票数 11
1
回答
XSLT将多个输入文件从
hocr
转换为alto xml Saxon。
在使用Saxon将多个输入文件从
hocr
转换为alto (每个输入文件需要一个xml输出)时遇到了困难,所以当我尝试对多个文件使用collection()命令时,我能够一次转换一个文件,但得到错误消息‘(
Hocr
))‘。因此,我知道我所使用的路径存在问题,但不确定在本例中如何正确使用集合()。任何帮助都将不胜感激。我一直在尝试的命令是: File:///c:/?select=*.(
hocr
))-xsl:
hocr
-to-ALTO- \
hocr
_ALTO 2.0.xs
浏览 5
提问于2020-07-14
得票数 1
1
回答
在android中输出用于tesseract OCR的
HOCR
输出
我想在tesseract中打开
hocr
输出,在这个中,我尝试将变量tessedit_create_
hocr
设置为true,但在输出中看不到
hocr
。FileUtil.getAppFolder(), "eng", TessBaseAPI.OEM_TESSERACT_CUBE_COMBINED); baseApi.setImage(bitmap); Strin
浏览 4
修改于2014-01-22
得票数 4
回答已采纳
2
回答
在哪里可以找到
HOCR
文件的样本?
在哪里可以找到
hocr
格式的文件的示例或示例?( OCR提取的文本与页面坐标一起存储的格式。)谢谢!
浏览 0
提问于2011-11-25
得票数 3
1
回答
使用Tesseract
hOCR
提取文本属性
因此,下面的所有行(在
hOCR
输出中)都具有相同的字体系列和大小: <span class='ocrx_word' id='word_6' title="bbox 1177 491 1637 549">
浏览 2
提问于2013-11-16
得票数 3
回答已采纳
1
回答
Tesseract CLI
hocr
和tessdata-dir选项不一起工作
我在尝试运行这个命令时出错read_params_file: Can't open
hocr
tesseract orig.jpg stdout -oem 4
hocr
tesseract orig.jpg stdout
浏览 3
提问于2017-09-14
得票数 0
回答已采纳
2
回答
Pytessaract image_to_pdf_or_
hocr
函数在AWS中不工作
但是,当我尝试像这样使用image_to_pdf_or_
hocr
时:File "/var/task/pytesseract/pytesseract.py", line 432, in image_to_pdf_or_<e
浏览 3
提问于2021-03-15
得票数 3
1
回答
将
HOCR
输出转换为字符串(用于正则表达式目的)的策略是什么?
我正在使用Pytesseract,并希望将
HOCR
输出转换为字符串。当然,这样的函数是在Pytesseract中实现的,但我想了解更多关于如何实现它的可能策略。from pytesseract import image_to_pdf_or_
hocr
hocr
_output = image_to_pdf_or_
hocr
(image, extension='
hocr
浏览 18
提问于2019-08-09
得票数 2
1
回答
从tesseract
hocr
xhtml文件中提取数据
我试图使用Python从Tesseract的
hocr
输出文件中提取数据。我们仅限于tesseact版本3.04,因此没有image_to_data函数或tsv输出可用。
浏览 1
提问于2018-06-05
得票数 4
回答已采纳
1
回答
Tesseract:在
hOCR
文件中获取word置信度(x_wconf)
我目前使用Java通过命令行调用Tesseract,输出模式设置为
hOCR
。我几乎不知道任何与C编程相关的东西,虽然我能读懂源代码,但仅此而已。 我希望能够在
hOCR
文件中获得单词置信度信息。
浏览 0
修改于2013-12-02
得票数 2
1
回答
Windows Tesseract OCR得到分散的
HOCR
输出,而不是干净的标准格式
我正在寻找is.
HOCR
(HTML)的输出。在内容方面,我得到了完美的输出,但是格式看起来非常混乱。但同样,当我打开记事本++时,它给出了一种清晰的格式。下面给出了windows命令行需要您的帮助,以获得有组织的
hocr
格式的记事本作为附件。
浏览 10
提问于2022-02-09
得票数 0
1
回答
使用Tesseract的
hOCR
文件/确定是否有高质量的文本层
2)是否可以将已经包含文本层的
hOCR
分解为单独的每页PDF文件,以便可以使用边界框突出显示这些页面的特定区域,并使用从相应
hOCR
文件中检索到的该区域的文本?3)当使用Tesseract将OCR文本保存为
hOCR
格式时,这是否提供了足够的信息,以便能够从
hOCR
文件中检索与创建
hOCR
文件的PNG上的确切区域相对应的任意文本块? 提前感谢
浏览 11
提问于2018-02-14
得票数 2
第 2 页
第 3 页
第 4 页
第 5 页
第 6 页
点击加载更多
领券