首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >信息抽取和文本挖掘有什么不同?

信息抽取和文本挖掘有什么不同?
EN

Stack Overflow用户
提问于 2013-06-22 14:10:05
回答 2查看 7.8K关注 0票数 11

这看起来可能很容易。但我很困惑。

文本挖掘和信息抽取的区别是什么?

EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2013-06-22 14:20:53

信息提取

(即)是从非结构化和/或半结构化机器可读文档中自动提取结构化信息的任务。在大多数情况下,这项活动涉及通过自然语言处理(NLP)来处理人类语言文本。多媒体文档处理中的最新活动,如自动标注和从图像/音频/视频中提取内容,可以看作是信息提取。

文本挖掘

是从信息资源集合中获取与信息需求相关的信息资源的活动。搜索可以基于元数据或全文索引。

与信息检索相比,文本挖掘是一个广阔的领域。典型的文本挖掘任务包括文档分类、文档聚类、构建本体、情感分析、文档摘要、信息提取等。其中,信息检索通常涉及爬行、解析和索引文档、检索文档。

Source

票数 6
EN

Stack Overflow用户

发布于 2016-10-02 21:48:33

首先,让我们来看看这两个重要单词的含义。

文本挖掘是通过对各种文本resources.It的自动分析,自动发现以前未知的新信息,首先从文本源中提取事实和事件,然后形成新的假设,这些假设将被传统的数据挖掘和数据分析方法进一步探索。

信息提取更像是自然语言处理&机器学习问题,您可以训练机器从原始文本中提取隐藏的信息。

因此,可以说,与信息提取相比,文本挖掘是一个广阔的领域。文本挖掘关注的是在非结构化文本中寻找模式。信息抽取(IE)的相关任务是定位自然语言文档中的特定项

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/17247874

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档