如果你有一个文本列表,并且一个人对某些主题感兴趣,那么为一个给定的人选择最相关的文本的算法是什么?
我认为这是一个相当复杂的话题,作为一个答案,我希望有几个方向来研究文本分析,文本统计,人工智能等的各种方法。
谢谢
发布于 2011-11-05 03:57:17
对于这项任务,有相当多的算法。至少太多了,不能在这里一一列举。首先是一些起点:
现在来看一些实际的例子。
发布于 2011-11-04 20:17:30
作为一个搜索引擎工程师,我认为这个问题最好结合使用两种技术来解决。
搜索技术1,搜索( or other algorithms)
使用搜索为您没有用户统计数据的内容创建基准模型。有许多技术,但我认为Apache Lucene/Solr代码库是最成熟和最稳定的。
技术2,基于用户的推荐器( other algorithms)
当您开始获取用户统计数据时,可以使用它来增强文本分析系统使用的相关性模型。解决这类问题的一个快速增长的代码库是Apache Mahout项目。
发布于 2011-11-04 21:00:00
请查看Programming Collective Intelligence,这是一个非常好的关于这些方面的各种技术的概述。可读性也很好。
https://stackoverflow.com/questions/8008850
复制相似问题