文章/答案/技术大牛

发布

社区首页 >问答首页 >需要在Python中为语料库创建直方图

问需要在Python中为语料库创建直方图
EN

Stack Overflow用户

提问于 2011-09-29 15:46:17

回答 3查看 1.7K关注 0票数 1

import nltk
from nltk.book import *
from nltk.corpus import brown
corpus_text = brown.words()
word_freq = FreqDist(corpus_text)
word_hist = dict()

for k,v in word_freq.iteritems():
   if key in word_hist:
      word_hist[v] = word_hist[v] + 1
   else:
      word_hist[v] = 1 

print word_hist.viewkeys()
print word_hist.viewvalues()

我在这里的字典处理上犯了一个错误。需要创建一个字典，它的关键字是来自freqdict的单词，值是相应单词的编号。如何执行此增量？

我敢肯定

      word_hist[v] = word_hist[v] + 1
   else:
      word_hist[v] = 1

有个bug。

nltk

dictionary

python

回答 3

Stack Overflow用户

回答已采纳

发布于 2011-09-29 16:06:28

当然了。看起来你是在用它的一个值(加1)替换word_hist dict。试一试

word_hist[v] = word_hist[v] + 1

甚至更好

word_hist[v] += 1

而不是。

编辑:还有另一个bug：

for k,v in word_freq.iteritems():
   if key in word_hist:
      word_hist[v] = word_hist[v] + 1
   else:
      word_hist[v] = 1

这没有任何意义。在word_hist中测试key是否存在，但随后使用了v。

我不知道key是什么，但可以同时使用k或v。

票数 1

Stack Overflow用户

发布于 2011-09-29 18:11:17

from collections import defaultdict
word_hist = defaultdict(int)

for k,v in word_freq.iteritems():
    word_hist[v] +=1

票数 1

Stack Overflow用户

发布于 2021-12-03 14:37:20

这肯定有一个bug，但前一行也有。

if key in word_hist:
      word_hist[v] = word_hist[v] + 1
   else:
      word_hist[v] = 1

应该是

if k in word_hist:
    word_hist[k] = word_hist[k] + 1
else:
    word_hist[k] = 1

你不需要从word_freq中获取v。

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/7594056

复制

相似问题

问需要在Python中为语料库创建直方图
EN

回答 3

Stack Overflow用户

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问需要在Python中为语料库创建直方图EN

回答 3

Stack Overflow用户

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问需要在Python中为语料库创建直方图
EN