发布于 2011-02-27 06:28:25
不如:
static double idf(int docTermCount, int totalNumDocuments)
{ return Math.log((double)docTermCount / (double)totalNumDocuments); }(这基本上是一种幽默的说法:告诉我们更多关于你的情况,也许我们能帮上忙。什么是文件?它的代表是什么?
只需使用卢塞尼
Apache (商标)是一个高性能的、功能齐全的文本搜索引擎库,完全用Java编写.这是一种适用于几乎任何需要全文搜索的应用程序的技术,尤其是跨平台搜索。
它提供以色列国防军。
如果你不使用Lucene
好的,我可以根据下面的评论勾勒出一个解决方案,看看它是否有帮助:
File对象。BufferedInputReader周围的InputStreamReader来打开File.getInputStream())。Scanner对象或类似的。Map<String,Record>)来将文件中的术语映射到包含术语计数和位置的Record。您可能会考虑使用一个可以为您完成部分或全部任务的工具。例如,我想卢塞尼可能会有一些基础设施可供使用。
https://stackoverflow.com/questions/5131776
复制相似问题