我正在制作一个应用程序,它根据每个文档的单词/短语内容将一组文档(数量从最少~10个文档到最多~2000个文档)组织成组。每个文档的范围可以从一段文字到大约一页半。
我不是在寻找一个基于初始搜索词对结果进行聚类的文档聚类库,而是在寻找一个没有搜索词的聚类库。
有没有可以很容易地与Objective-C项目集成的文档聚类的库?
发布于 2011-09-13 11:44:27
我对对象C的理解不是很透彻,但是如果你可以导入原生C代码,那么你可以使用greedyRSC启发式。我们在路透社和洛杉矶时报语料库上取得了非常好的结果。
消息和C代码的描述可在此处获得:http://research.nii.ac.jp/~meh/greedyRSC/rscpage.html
https://stackoverflow.com/questions/4988366
复制相似问题