腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
搜索
关闭
文章
问答
(9999+)
视频
开发者手册
清单
用户
专栏
沙龙
全部问答
原创问答
Stack Exchange问答
更多筛选
回答情况:
全部
有回答
回答已采纳
提问时间:
不限
一周内
一月内
三月内
一年内
问题标签:
未找到与 相关的标签
筛选
重置
1
回答
大型
文档
的实体
抽取
我需要从word和pdf
文档
中提取实体。文件可在10至20页范围内。是否有可扩展的库/API可供我们插入处理管道?任何对不同解决方案的比较研究都是有帮助的。
浏览 2
提问于2018-04-28
得票数 0
回答已采纳
1
回答
是否可以使用.NET客户端库为自定义
文档
抽取
器创建标签/实体类型?
我已经成功地在Google控制台中设置了一个自定义
文档
抽取
处理器,如所描述的,并且能够熟悉Google工作流。我还能够创建一个带有自定义标签的
文档
架构,并导入培训和评估
文档
来训练处理器版本。我能够训练模型和处理
文档
。但是,我也需要能够使用客户端库创建标签,但我不知道使用客户端库是否可能这样做? 我查看了
文档
和,没有看到任何引用可以使用客户机库添加您自己的标签。
浏览 5
提问于2022-11-24
得票数 0
回答已采纳
1
回答
OpenCV中
文档
的模式
抽取
层
rect是由松散连接的白色像素组成的矩形区域,它包含
文档
的某个逻辑部分。我们考虑简单的8邻域连通性,并对二值图像进行连通分量(等高线)分析,从而对文本分量进行分割。你能帮我把这个理论翻译成opencv源代码或者给我任何相关的链接吗,我目前正在为我的论文做
文档
图像分析。
浏览 3
提问于2011-12-28
得票数 2
1
回答
一种
抽取
文档
中合法引文的算法
我想训练一个机器学习模型来学习和提取文本
文档
中的合法引用模式。我可以使用的最佳算法是什么?我的训练数据样本法律引用集看起来像, Brill v.Div. 1960)r'(?:[A-Z]\w*\.? )+v\. .*?
浏览 23
提问于2021-09-02
得票数 1
5
回答
文本
抽取
中的
文档
布局分析
我需要分析不同
文档
类型的布局结构,如:pdf、doc、docx、odt等。 我的任务是:给出一个
文档
,将文本分组,找出每个文本的正确边界。Apache只提取文本,所以如果我的
文档
有两列,则Tika提取第一列的整个文本,然后提取第二列的文本,即ok...but --有时第一列上的文本与第二列上的文本相关,就像一个具有行关系的表。如何从同一块下的
文档
和组装相关文本(理解
文档
的布局结构)中提取文本?
浏览 12
修改于2022-07-15
得票数 6
回答已采纳
3
回答
用DOMDocument实现从HTML
文档
中按类
抽取
在DOMDocument类中,有按id和按标记名(getElementById & getElementsByTagName)获取元素的方法,但不能按类获取元素。有没有办法做到这一点?<html><body><div class="foo"></div></body>
浏览 0
提问于2011-02-26
得票数 5
3
回答
如何找到从XML
文档
中
抽取
的一组5分的平均值?
现在,它只是简单地显示每个分数的延迟。我想知道我如何才能准确地取得相同的成绩,并找到它们的平均值,并显示在页面底部。我不知道如何进一步阐明这个问题,但我肯定会回答与此有关的任何问题。using System.Xml;using System.Linq;using System.Threading.Tasks;{ {
浏览 1
修改于2020-03-10
得票数 0
回答已采纳
1
回答
用MongoDB实现PDF、word和文本
文档
的信息
抽取
、索引和检索
MongoDB是否有一个功能,我可以存储PDF、文本或. do /docx
文档
并搜索它们,或者在它们的内容中找到一个关键字,在两个
文档
之间进行匹配?例如:诊断代码,简短的描述,日期和数量。我想发出查询,在那里我可以找到任何具有匹配日期和相同诊断的
文档
。(例如“肺炎”,“2012年12月12日”) 如果只使用MongoDB的API就可以这样做,还是需要做一些预处理?如果可能的话,你能给我介绍一下好的例子和
文档
吗?
浏览 0
修改于2013-05-19
得票数 3
1
回答
JMS发布服务器-如何从XML请求中获取值
我试图从从JMS发布服务器发送到JMS订阅服务器的xml
文档
中获取一个值。<sys1> <id>123</id> </req>
文档
会被转换。我需要检查xml
文档
浏览 8
提问于2021-12-29
得票数 0
回答已采纳
1
回答
ElasticSearch返回聚合随机顺序
我得到了以下的ElasticSearch-query,从“cat.id”上分组的每个“类别”中获取10个
文档
: "test": { "terms": {然而,我似乎找不到一种方法,从每个存储桶中随机
抽取
10个结果。结果总是一样的。我想从每个存储桶中随机
抽取
10个项目。我尝试了所有打算用于
文档
的东西,但似乎都不起作用。
浏览 3
提问于2018-06-20
得票数 0
2
回答
如何在使用JMeter提取器时忽略XPath中html标记的错误
我成功地在我的XPath测试中添加了一个JMeter
抽取
器。现在,我收到了JMeter.log中的错误,抱怨我们的网页中有两个html标签。这些标记是由我们创建的,是我们可以在代码中使用的标记。InputStream: Doctype给出的是“InputStream:
文档
内容看起来像HTML4.01过渡性33条警告,发现了2个错误!此
文档
在使用HTML生成整理版本之前必须修复错误。如果我在测试中禁用了XPath
抽取
器,我就不会再得到这些错误。所以,我知道XPath抽油车带来了这个。但是,为了获得运行测试所需的其他信息,我需
浏览 5
修改于2014-01-29
得票数 0
回答已采纳
1
回答
使用CMSIS FIR系数进行
抽取
似乎不正确
由于ADC的采样率为4000 by,因此我希望减少发送的样本数量,即
抽取
(我认为是什么),在
抽取
因子4之后,我将有1000 by的样本,然后我可以插回4000 by。我从here和其他参考文献中学习了基本的
抽取
和插值,并使用了CMSIS FIR
抽取
器和FIR内插器。: 4number of samples to process: 8 滤波器系数以变量{0,0,0,1}的形式存储,即
文档
我对FIR滤波器系数的理解是否正确,即1
浏览 24
修改于2021-10-15
得票数 0
1
回答
正则表达式
抽取
器在正则表达式中的应用
当两个正则表达式提取器都在相同的HTTP请求下时,我需要使用存储在下一个正则表达式
抽取
器中的变量中的以前正则表达式
抽取
器的结果。\\"/><input type=\\\\"hidden在
文档
中哪里可
浏览 2
修改于2022-05-05
得票数 -2
2
回答
什么标记语言通常用于注释信息提取语料库
我正在构建一个信息
抽取
的语料库,用于提取特定类型的信息,并且我正在努力决定对实体进行注释的最佳方法。由于本
文档
是在1997年编写的,我猜想使用这种基于SGML的方法已经过时了,因此必须有更好的方法来实现这一点,例如使用OWL、RDF或XML。是否有更新的行业标准来注释信息
抽取
语料库?
浏览 5
提问于2017-05-19
得票数 1
回答已采纳
1
回答
选择带有pymongo过滤器的随机
文档
?
random document from the mycoll collection. { $sample: { size: 1 } }但是,如果我需要过滤
文档
,然后随机
抽取
一个
文档
呢?
浏览 4
提问于2017-11-21
得票数 9
回答已采纳
1
回答
Elasticsearch获得随机
文档
,每个类别至少有5个
我想从每个类别中
抽取
至少5份的30份随机
文档
。请给我任何解决办法。
浏览 3
提问于2018-02-14
得票数 1
1
回答
在使用Plotly时,在使用dict和curly大括号初始化时是否有惯例?
关于堆栈溢出问题的
文档
和许多答案倾向于使用而不是这种偏好有什么特别的原因吗?我曾被告知,卷发大括号初始化是首选。有些例子是随机
抽取
的:
浏览 3
修改于2022-03-05
得票数 0
回答已采纳
1
回答
如何在1000份文件的校对中,从400份到500份之间随机
抽取
50个
文档
?
我正在使用skip limit and aggregate,但它不起作用。.skip(400).aggregate([{$sample: {size: 50}}])
浏览 2
修改于2022-11-30
得票数 0
回答已采纳
1
回答
使用颜色
抽取
三维网格
我正在使用Meshlab软件来
抽取
3D网格。这很好用,但是当我想要
抽取
顶点上有颜色的3D网格时,我不知道该使用哪种算法,因为没有人管理颜色(MC边缘折叠,聚类
抽取
,二次边缘折叠
抽取
)。对于用颜色
抽取
3D网格有什么建议吗?此外,我会感兴趣的,如果你知道一些代码来做这件事。谢谢
浏览 3
提问于2018-10-28
得票数 0
1
回答
pymongo - "OperationFailure:管道阶段规范对象必须只包含一个字段“
我想随机
抽取
字段'date‘大于或等于'2020-01-01’的给定数量的
文档
。以下是我的代码最后一行显示以下错误 有没有人知道怎么得到写结果?
浏览 13
提问于2020-06-08
得票数 0
回答已采纳
第 2 页
第 3 页
第 4 页
第 5 页
第 6 页
第 7 页
第 8 页
第 9 页
第 10 页
第 11 页
点击加载更多
领券