搜索 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

1回答

基于规则的原始文本信息抽取

创建此字母表的术语字典并使用字典从原始文本中提取呼号的可能方法有哪些？也请告诉我什么算法可以用来解决我的问题

浏览 0提问于2018-12-29得票数 1

2回答

信息抽取和文本挖掘有什么不同？

文本挖掘和信息抽取的区别是什么？

浏览 7提问于2013-06-22得票数 11

回答已采纳

5回答

谁是信息抽取，文本挖掘和自然语言处理领域的主要作者？

我想知道谁是信息提取、自然语言处理和文本挖掘的主要作者/研究人员，以便阅读他的论文/书籍/作品。

浏览 2修改于2013-09-24得票数 0

回答已采纳

1回答

用MongoDB实现PDF、word和文本文档的信息抽取、索引和检索

MongoDB是否有一个功能，我可以存储PDF、文本或. do /docx文档并搜索它们，或者在它们的内容中找到一个关键字，在两个文档之间进行匹配？我需要存储另一个名为“physician_diagnosis.pdf”的文本，其中包含一个匹配的简短描述。我想发出查询，在那里我可以找到任何具有匹配日期和相同诊断的文档。

浏览 0修改于2013-05-19得票数 3

1回答

web信息抽取

我想创建一个购物搜索引擎，显示来自许多网站的产品，我想知道如何从这些网站检索有关产品的信息。我对搜索引擎部分不感兴趣，但从网页中自动提取产品信息的方式使用自动生成的模板。

浏览 0修改于2011-07-05得票数 0

1回答

信息抽取->关系

“这部电影太棒了。背景音乐很古怪，灯光也很完美。”电影:令人惊叹的背景音乐:古怪的灯光:完美我正在使用斯坦福大学的NLP库，但我不知道该怎么做。

浏览 2提问于2014-08-12得票数 0

1回答

Tika信息抽取

我可以知道如何使用Tika在网页中提取表格形式的信息，如数字吗？为此，Tika有解析器吗？谢谢

浏览 0修改于2012-08-16得票数 1

1回答

DBpedia信息抽取框架

有没有人用过维基百科的数据抽取？我需要在工作中使用它。谢谢!

浏览 1提问于2010-11-14得票数 2

1回答

信息抽取工具包

我正在寻找信息提取库，在那里我可以拥有半结构化的信息，这些信息可能包含隐藏的或不完整的数据。我想训练一些分类器来根据结构提取内容。我正在构建一个工具，我可以在其中选择浏览器中的文本，它将(通过一些web服务调用)生成一个分类器，该分类器可以用于其他文档以提取文本。我主要研究如何使用文档的结构来指示内容是什么。

浏览 1修改于2013-10-18得票数 1

回答已采纳

1回答

无法试用文智的下载抽取API？

开发者实验室、api

无法试用文智的下载抽取API[附加信息]

浏览 333提问于2018-08-13

2回答

什么标记语言通常用于注释信息提取语料库

我正在构建一个信息抽取的语料库，用于提取特定类型的信息，并且我正在努力决定对实体进行注释的最佳方法。是否有更新的行业标准来注释信息抽取语料库？

浏览 5提问于2017-05-19得票数 1

回答已采纳

1回答

文本数据集(NLP)抽样方法

我正在处理两个文本数据集，一个是68k文本样本，另一个是100k文本样本。我已将文本数据集编码为bert嵌入。我计划至少从68k数据集中抽取10k样本子集，从100 k数据集中抽取10k子集。我可以从68k中随机选择10k，但这种方法并不是最好的取样方法。对于如何在保持原始总体的概率分布的同时，如何从68k样本中抽取嵌入(文本)，有什么建议吗?对于一个样本子集，有多少个样本足够？谢谢!

浏览 0修改于2020-08-30得票数 1

1回答

经过一段时间，我发现这可以通过两种方式来实现，我遵循的总结，这是产生良好的结果与预先训练的模型问题:我到目前为止看过的大多数抽取总结器(PyTeaser、PyTextRank和Gensim)都不是基于监督学习，而是基于朴素贝叶斯分类器、tf-以色列国防军、POS标记、基于关键字频率、位置等的句子排序清除文本并应用停止词筛选器使用词汇量为20000的托卡器from keras.preprocessing.text i

浏览 0修改于2019-01-22得票数 3

2回答

从文本文件中提取某些数据的正则表达式

我有一篇用这种格式写成句子的文本：t-extraction 1 This is a语句，t-抽取，s-抽取单词被重复.这些数字是句号1,2，.。我需要将这些信息映射到sql表中，所以我应该提取它们。我需要第一句和第二句(第一行没有t-extraction和数字，第一行没有词)。

浏览 3修改于2014-10-21得票数 0

1回答

逻辑语义、信息抽取与总结

如果我想从任何特定领域的文本中检索有意义的信息，并理解任何文本的一般概念。原谅我的无知。

浏览 1修改于2015-10-21得票数 1

回答已采纳

1回答

PV-DBOW是如何工作的？

不带词序的段落向量:上述方法考虑了段落向量与单词向量的连接，以预测文本窗口中的下一个单词。另一种方法是忽略输入中的上下文词，而是强制模型预测输出中段落中随机抽取的单词。实际上，这意味着在随机梯度下降的每一次迭代中，我们采样一个文本窗口，然后从文本窗口中抽取一个随机单词，并在给定段落向量的情况下形成一个分类任务。我有几个问题：为什么要在随机抽取单词之前先对文本窗口进行抽样？

浏览 0修改于2019-04-02得票数 1

1回答

不放松文本格式的文本提取

嗨，谢谢。

浏览 4提问于2016-07-15得票数 1

回答已采纳

13回答

Emacs:如何删除文本而不杀环？

我只想删除一些文本，以便我可以删除一些其他文本，而不是。我怎么能这么做？C-w削减选定的文本，以杀死戒指，而我最终没有我想要的文本。另外，是否可以直接抽取文本()而不是文本()，而无需按下按钮就可以杀死它？

浏览 19提问于2009-03-12得票数 89

1回答

摘要-文本排序算法

使用文本排序算法进行摘要比使用BERT摘要有什么优点？即使这两种方法都可以作为抽取摘要的方法，但对于文本排名是否有什么特别的优势？

浏览 3修改于2021-11-27得票数 1

回答已采纳

1回答

这个库能检测到JPG是RGB还是CMYK格式吗？

谢谢元数据抽取器库，这真的很有帮助。它给了我所有我需要的信息，除了JPG是RGB还是CMYK格式。信息是在那里，我只是没有看到它，还是这个库没有返回这个属性？谢谢

浏览 1提问于2018-12-04得票数 1

回答已采纳

第 2 页第 3 页第 4 页第 5 页第 6 页第 7 页第 8 页第 9 页第 10 页第 11 页

点击加载更多

基于规则的原始文本信息抽取

信息抽取和文本挖掘有什么不同？

谁是信息抽取，文本挖掘和自然语言处理领域的主要作者？

用MongoDB实现PDF、word和文本文档的信息抽取、索引和检索

web信息抽取

信息抽取->关系

Tika信息抽取

DBpedia信息抽取框架

信息抽取工具包

无法试用文智的下载抽取API？

什么标记语言通常用于注释信息提取语料库

文本数据集(NLP)抽样方法

监督抽取文本摘要

从文本文件中提取某些数据的正则表达式

逻辑语义、信息抽取与总结

PV-DBOW是如何工作的？

不放松文本格式的文本提取

Emacs:如何删除文本而不杀环？

摘要-文本排序算法

这个库能检测到JPG是RGB还是CMYK格式吗？

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐