首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >需要在Python中为语料库创建直方图

需要在Python中为语料库创建直方图
EN

Stack Overflow用户
提问于 2011-09-29 15:46:17
回答 3查看 1.7K关注 0票数 1
代码语言:javascript
复制
import nltk
from nltk.book import *
from nltk.corpus import brown
corpus_text = brown.words()
word_freq = FreqDist(corpus_text)
word_hist = dict()

for k,v in word_freq.iteritems():
   if key in word_hist:
      word_hist[v] = word_hist[v] + 1
   else:
      word_hist[v] = 1 

print word_hist.viewkeys()
print word_hist.viewvalues()

我在这里的字典处理上犯了一个错误。需要创建一个字典,它的关键字是来自freqdict的单词,值是相应单词的编号。如何执行此增量?

我敢肯定

代码语言:javascript
复制
      word_hist[v] = word_hist[v] + 1
   else:
      word_hist[v] = 1

有个bug。

EN

回答 3

Stack Overflow用户

回答已采纳

发布于 2011-09-29 16:06:28

当然了。看起来你是在用它的一个值(加1)替换word_hist dict。试一试

代码语言:javascript
复制
word_hist[v] = word_hist[v] + 1

甚至更好

代码语言:javascript
复制
word_hist[v] += 1

而不是。

编辑:还有另一个bug:

代码语言:javascript
复制
for k,v in word_freq.iteritems():
   if key in word_hist:
      word_hist[v] = word_hist[v] + 1
   else:
      word_hist[v] = 1

这没有任何意义。在word_hist中测试key是否存在,但随后使用了v

我不知道key是什么,但可以同时使用kv

票数 1
EN

Stack Overflow用户

发布于 2011-09-29 18:11:17

代码语言:javascript
复制
from collections import defaultdict
word_hist = defaultdict(int)

for k,v in word_freq.iteritems():
    word_hist[v] +=1
票数 1
EN

Stack Overflow用户

发布于 2021-12-03 14:37:20

这肯定有一个bug,但前一行也有。

代码语言:javascript
复制
if key in word_hist:
      word_hist[v] = word_hist[v] + 1
   else:
      word_hist[v] = 1 

应该是

代码语言:javascript
复制
if k in word_hist:
    word_hist[k] = word_hist[k] + 1
else:
    word_hist[k] = 1

你不需要从word_freq中获取v。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/7594056

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档