文章/答案/技术大牛

发布

社区首页 >问答首页 >Python:统计语料库文件中的特定单词

问Python:统计语料库文件中的特定单词
EN

Stack Overflow用户

提问于 2011-12-19 21:31:36

回答 1查看 419关注 0票数 0

我想在我的语料库的每个文件中统计特定的单词。这是我的代码..它工作得很好。

num=   nltk.FreqDist(
      (target,fileid)
       for fileid in reader.fileids()
       for w in reader.words(fileid)
       for target in ['have'])

但是结果是这样的..FreqDist：'2009.txt'：141205，'20.txt'：43201，'2.txt':41232，'4.txt':40859，'5.txt'：40805，.....

我希望在一行中逐个查看所有值。就像..。

'2009.txt‘141205

'20.txt‘43201

我另外尝试了这段代码

  for results in num:
      print results

但它只显示'have'，''200.txt'...未显示FreqDist编号。

另外，我还尝试了nltk.ConditionalFreqDist()..这需要永远..。

我不知道为什么..请帮帮我。我花了差不多4-5个小时来处理这个问题。

提前谢谢你。

python

nltk

回答 1

Stack Overflow用户

回答已采纳

发布于 2011-12-19 21:39:56

我对NLTK并不熟悉，但是您似乎正在遍历一个类似于dict的对象。

那这个呢？

for file, n in num.iteritems():
    print file, n

票数 2

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/8562079

复制

相似问题

问Python:统计语料库文件中的特定单词
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问Python:统计语料库文件中的特定单词EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问Python:统计语料库文件中的特定单词
EN