我是一个非常有用的问答网站的新手,而且我的英语也不是很好,很抱歉。
我对一个web项目很感兴趣,我认为它并不难做,而且是一个简化的冲浪。
Algorithm description 1
Algorithm description 2
这个算法是确保孩子是非常简单的,因为它可以快速分析网页内容并找到相关信息。
谁能告诉我,这个算法是如何工作的,我试图做出类似的东西?
这个算法是基于什么原则实现的?
谢谢!
发布于 2012-01-09 04:36:40
我只是回答了非常相似的question。在您的特定情况下,有必要手动创建主题列表,使用机器学习对其进行一些示例训练,然后在搜索期间,将每个搜索结果分类为其中一个主题。因此,您将获得按主题分组的搜索结果。
更新。好的,下面是一种可能的方法的逐步说明。
首先,看看我最近关于文档相似度计算的post。然后执行以下操作:
为了计算2个文本之间的相似度(如我的帖子中所述)或为多个文档集合查找内容,每个类别(主题)都有一个,您想要使用的每个类别(食物,IT,政治,医药,etc.).
发布于 2015-04-25 18:37:10
对我来说,NLP是一个查看原始文本并对其进行标记的程序。
我这样看它是因为我想把它当作GA的训练者(自我监督),只要你在马尔可夫链中记录用户对它说了什么,这样你就可以使用尽可能多的处理器能力来加速突变。
注意,我还没有做到这一点,但我认为这个想法很酷,它的黑客,似乎它会工作。
https://stackoverflow.com/questions/8780770
复制相似问题