我需要对文档进行分析,并编制统计数据,说明每个单词序列使用了多少次(因此,分析的不是单个单词,而是一批重复出现的单词)。我读到压缩算法所做的事情与我想做的类似--用一段信息报告它的频率来创建文本块字典。应该类似于http://www.codeproject.com/KB/recipes/Patterns.aspx,您有用C#编写的东西吗?
发布于 2010-05-28 00:35:14
这很容易实现。
Dictionary<string, int>来获得计数.https://stackoverflow.com/questions/2925946
复制相似问题