首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >句子分析和标记的算法

句子分析和标记的算法
EN

Stack Overflow用户
提问于 2010-05-28 00:27:01
回答 1查看 1.7K关注 0票数 1

我需要对文档进行分析,并编制统计数据,说明每个单词序列使用了多少次(因此,分析的不是单个单词,而是一批重复出现的单词)。我读到压缩算法所做的事情与我想做的类似--用一段信息报告它的频率来创建文本块字典。应该类似于http://www.codeproject.com/KB/recipes/Patterns.aspx,您有用C#编写的东西吗?

EN

回答 1

Stack Overflow用户

发布于 2010-05-28 00:35:14

这很容易实现。

  1. 使用拆分( string类的成员函数)将字符串拆分为单词。(可以在codeproject url中使用分隔符)。
  2. 一个for循环来枚举出所有的n-图,并使用Dictionary<string, int>来获得计数.
票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/2925946

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档