首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何在java中实现以色列国防军?

如何在java中实现以色列国防军?
EN

Stack Overflow用户
提问于 2011-02-27 06:20:16
回答 1查看 2.9K关注 0票数 2

可能重复: 用java编写的Tf下手的任何教程或代码

以色列国防军是反向文档频率。

国防军=日志(载有术语/文件数量的文件)

怎么用java来做呢?

有什么建议吗?

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2011-02-27 06:28:25

不如:

代码语言:javascript
复制
static double idf(int docTermCount, int totalNumDocuments) 
{ return Math.log((double)docTermCount / (double)totalNumDocuments); }

(这基本上是一种幽默的说法:告诉我们更多关于你的情况,也许我们能帮上忙。什么是文件?它的代表是什么?

只需使用卢塞尼

Apache (商标)是一个高性能的、功能齐全的文本搜索引擎库,完全用Java编写.这是一种适用于几乎任何需要全文搜索的应用程序的技术,尤其是跨平台搜索。

它提供以色列国防军

如果你不使用Lucene

好的,我可以根据下面的评论勾勒出一个解决方案,看看它是否有帮助:

  1. 您需要识别要考虑的文件。也许你有一个明确的列表,或者你有一个文件名的模式?
  2. 一旦确定了文件,就需要对它们进行迭代,可能是java中的File对象。
  3. 对于每个文件,您都需要打开该文件(例如,通过使用包装在BufferedInputReader周围的InputStreamReader来打开File.getInputStream())。
  4. 您需要知道如何标记文件内容;可能只是使用空格和Scanner对象或类似的。
  5. 您将需要一个数据结构(可能是Map<String,Record>)来将文件中的术语映射到包含术语计数和位置的Record

您可能会考虑使用一个可以为您完成部分或全部任务的工具。例如,我想卢塞尼可能会有一些基础设施可供使用。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/5131776

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档