搜索 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

2回答

如何在python中裁剪图像的底部(部分带有字幕)

我正在从python的视频中提取字幕，我在python中使用了opencv来实现这一点。我把它分成了几个帧，每个帧作为图像存储在我的磁盘上，我在it.But上做ocr，我不想在整个图像上执行ocr，我只想要字幕部分，我只想用以下值( 278:360 )手工裁剪图像，因为我的图像大小是360但是图像大小因不同的视频files.Now而不同，我的问题是如何提前裁剪字幕部分( programatically.Please do answer.Thanks )。

浏览 5提问于2017-10-21得票数 3

回答已采纳

1回答

在GNU/Linux中打开HDMV PGS字幕

我想知道GNU/Linux中是否有可以读取BluRay字幕的软件。我说的不是像每个人要求的那样把OCR转换成SRT，而是阅读它们来查看每一行的时间，打开代表每行文字的图像。根据mkvextract的说法，扩展应该是.sup，但是当提取带有该扩展名的HDMV字幕时，GNOME字幕编辑和Gaupol似乎都无法读取它。有没有人知道有什么软件能读懂它们？

浏览 0提问于2016-04-21得票数 4

回答已采纳

1回答

OCR在字幕编辑中的应用

当我在windows版本的字幕编辑中使用内置的OCR实用程序将.PGS字幕转换为.SRT格式时，我使用字幕编辑，但看起来Ubuntu版的字幕编辑没有这种功能.或者它是否需要安装其他元素才能工作？还有人在Ubuntu (16.04到17.10)中使用字幕编辑(16.04到17.10)，并且知道是否有一种方法可以“打开”它的OCR功能，就像在windows中一样？

浏览 0提问于2018-03-31得票数 2

1回答

如何在python中连接至少三个二维数组？

我正在做目标导向的图像字幕。它有三种模式:提取特征、OCR分量和目标检测。从ResNeXt模型中提取的特征被重塑为一个大小的张量(49,2048)。OCR和对象检测组件的最大维数(300,1)分别为20字和10字。我想用线性投影将这些向量连接/嵌入到维数d=512的联合空间中。我该怎么做？

浏览 1修改于2022-03-28得票数 0

1回答

视频中的vb.net字符检测与图像提取

如果视频上有字幕或文字，请捕获该帧并提取到图像中。有人告诉我我可以用opencv或emgucv来做图像提取后

浏览 1提问于2020-04-16得票数 2

回答已采纳

1回答

将Sub/Idx转换为Srt

之前有一个类似的问题：如何将IDX/SUB字幕转换为文本SRT字幕文件？早在6年前就被问到了，解决方案是处理OCR。有一些在线工具可以实现这种转换，他们只是要求上传Sub+Idx文件并完成这项工作。

浏览 0提问于2018-07-31得票数 4

1回答

Tesseract OCR:获取文本和弦并提高最终OCR视频帧的质量

我正在使用tesseract OCR来识别视频帧的文本。我的问题是:如何才能检测到文本的正确位置？这将提高OCR的质量，取得更好的效果。如有任何建议，将不胜

浏览 2提问于2014-12-04得票数 1

1回答

在AWS中存储和执行大文本搜索

我需要从S3中的PDF和图像文件中获取OCR (光学字符识别)数据，以便用户可以对这些OCR数据执行搜索。我正在使用AWS提取的文本提取来获取OCR数据。我计划将OCR数据存储在Dynamo中，并在其中执行搜索查询。请提前帮忙谢谢！

浏览 1修改于2021-06-19得票数 1

回答已采纳

3回答

无法理解使用OCR引擎tesseract提取的文档中的坐标

我从tesseract中提取了一个图像文档，它提取成功。但我无法理解所提取的文件的坐标。它显示坐标，但让我知道，这些坐标代表像素或其他东西。他们代表的是什么立场 <!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/

浏览 5提问于2013-08-31得票数 7

1回答

PDFBox:区分透明文本和非透明文本

我有一个任务，在那里，我必须提取文本，是背后的图像，并已从图像本身OCR编辑。这一案文是透明的。问题是，有一个图像，它的背后有文字，不是OCR编辑的，它只是正常的文本，它是不透明的。这是一个具有代表性的pdf文件：图像OCR文本应该在第2页、第3页、第12页上提取，而文本也在第4页上提取。在第4页，图像后面没有OCR文本，但是图像下面有规则文本。我需要过滤掉它，因为我只需要OCR文本。

浏览 6修改于2021-07-15得票数 0

回答已采纳

1回答

使用ffmpeg从mp4中提取字幕

我一直在尝试从mp4文件中提取字幕，但是我不能得到正确的输出格式。我有理由相信这是一种基于图像的字幕格式。提取字幕以便我可以查看字幕图像的正确命令是什么？谢谢! ?

浏览 45提问于2020-09-17得票数 1

2回答

如何在Python中使用OCR提取数字或数字

我尝试使用OCR来提取数字。我的问题是如何使用OCR提取数字。图像如下所示：1 2 38 9 0 怎样才能得到我想要的结果呢？

浏览 3修改于2019-11-07得票数 2

2回答

从硬子床视频中提取字幕的程序？

我正在寻找一个程序，可以从一个视频提取/创建字幕的硬子床，而不是一个视频已经软子床，它是相当容易提取这些字幕。理想情况下，一个程序可以满足我的需要…运行在Windows 7上简单易用具有良好的用户界面可以从硬子床视频中提取字幕，或者至少可以从硬子床视频中创建字幕软床:软土基本上就像字幕，换句话说，你可以很容易地把它们关掉。而且，很容易从已经被软字幕</em

浏览 0修改于2021-04-11得票数 8

1回答

OCR图像预处理中如何分割噪声和文本

我在用OCR来对抗电视镜头中的字幕。(我正在使用Tesseact 3.xw/ C++)，我试图分割文本和背景部分作为OCR的预处理。这是最初的图片：预处理后的图像：OCR的结果是:西西曼克隆。正如上面的预处理图像所示，字母周围仍然存在一些“迷雾”，这使得OCR模块无法正常工作。

浏览 2修改于2017-12-20得票数 1

回答已采纳

2回答

在iphone中获取tesseract Ocr中的文本位置

使用tesseract，我已经提取了文本，iPhone.Now想要提取文本以及文本在xml中的位置。我使用GetHocrText来检索HTML语言中的文本。例如：-<span class='ocrx_word' id='xword_3_28' title=

浏览 7提问于2012-09-03得票数 2

1回答

模式( regex )与找到的值之间的相似性

我有一个包含文字信息的图像，并且： pattern = "(0[1-9]|[12][0-9]|3[01])/(0[1-9]|1[012])/(19|20)\d\d"12&#

浏览 2修改于2014-05-13得票数 5

回答已采纳

1回答

从视频中提取中文字幕

给出一个视频，比如：按顺序提取字幕就足够了，如果它也能提取时间戳，那就更好了。

浏览 5提问于2014-11-19得票数 1

1回答

如何在R中执行100%准确的OCR

我正在尝试从图像中提取文本 txt = ocr("D:/office/ML_PR_1/check.png", engine = tesseract("eng")) write(txt, filename) 观察到OCR将B读取为3</em

浏览 0修改于2017-06-12得票数 0

1回答

如何从JSON格式的PDF文件中提取基于部件的文本？

cascades that are likelv to be introduced in the next revision of this specification." "3https://api.dartlang.org/" ] } 我的第一个想法是使用Detectron2和库(如和 )，使用OCR技术(尤其是OCR技术)，使用深度学习来执行布局检测。我只

浏览 13修改于2022-10-31得票数 -1

1回答

正在尝试将从Tesseract OCR提取的文本传递到自定义google搜索

我正在尝试从tesseract OCR中提取文本，并将其用作Google Chrome搜索的搜索查询。我的shell脚本可以提取文本并启动Chrome，但我不知道如何将文本发送到chrome的搜索栏。Shell脚本while true echo "Waiting for trigger"screencapture -R31,205,420,420screens.png tesseract screens.pn

浏览 18修改于2018-05-01得票数 0

第 2 页第 3 页第 4 页第 5 页第 6 页第 7 页第 8 页第 9 页第 10 页第 11 页

点击加载更多

如何在python中裁剪图像的底部(部分带有字幕)

在GNU/Linux中打开HDMV PGS字幕

OCR在字幕编辑中的应用

如何在python中连接至少三个二维数组？

视频中的vb.net字符检测与图像提取

将Sub/Idx转换为Srt

Tesseract OCR:获取文本和弦并提高最终OCR视频帧的质量

在AWS中存储和执行大文本搜索

无法理解使用OCR引擎tesseract提取的文档中的坐标

PDFBox:区分透明文本和非透明文本

使用ffmpeg从mp4中提取字幕

如何在Python中使用OCR提取数字或数字

从硬子床视频中提取字幕的程序？

OCR图像预处理中如何分割噪声和文本

在iphone中获取tesseract Ocr中的文本位置

模式( regex )与找到的值之间的相似性

从视频中提取中文字幕

如何在R中执行100%准确的OCR

如何从JSON格式的PDF文件中提取基于部件的文本？

正在尝试将从Tesseract OCR提取的文本传递到自定义google搜索

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐