首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >NLP算法原理

NLP算法原理
EN

Stack Overflow用户
提问于 2012-01-09 04:00:02
回答 2查看 892关注 0票数 2

我是一个非常有用的问答网站的新手,而且我的英语也不是很好,很抱歉。

我对一个web项目很感兴趣,我认为它并不难做,而且是一个简化的冲浪。

Algorithm description 1

Algorithm description 2

这个算法是​​确保孩子是非常简单的,因为它可以快速分析网页内容并找到相关信息。

谁能告诉我,这个算法是如何工作的,我试图做出类似的东西?

这个算法是基于什么原则实现的?

谢谢!

EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2012-01-09 04:36:40

我只是回答了非常相似的question。在您的特定情况下,有必要手动创建主题列表,使用机器学习对其进行一些示例训练,然后在搜索期间,将每个搜索结果分类为其中一个主题。因此,您将获得按主题分组的搜索结果。

更新。好的,下面是一种可能的方法的逐步说明。

首先,看看我最近关于文档相似度计算的post。然后执行以下操作:

为了计算2个文本之间的相似度(如我的帖子中所述)或为多个文档集合查找内容,每个类别(主题)都有一个,您想要使用的每个类别(食物,IT,政治,医药,etc.).

  • Compute所有文档的公共向量)实现过程
  1. 用户执行搜索,计算您找到的每个结果的向量。
  2. 将每个结果分类到具有最相似公共向量的类别。
  3. 按计算类别对结果进行分组。
票数 1
EN

Stack Overflow用户

发布于 2015-04-25 18:37:10

对我来说,NLP是一个查看原始文本并对其进行标记的程序。

我这样看它是因为我想把它当作GA的训练者(自我监督),只要你在马尔可夫链中记录用户对它说了什么,这样你就可以使用尽可能多的处理器能力来加速突变。

注意,我还没有做到这一点,但我认为这个想法很酷,它的黑客,似乎它会工作。

票数 -1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/8780770

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档