我想在我的语料库的每个文件中统计特定的单词。这是我的代码..它工作得很好。
num= nltk.FreqDist(
(target,fileid)
for fileid in reader.fileids()
for w in reader.words(fileid)
for target in ['have'])但是结果是这样的..FreqDist:'2009.txt':141205,'20.txt':43201,'2.txt':41232,'4.txt':40859,'5.txt':40805,.....
我希望在一行中逐个查看所有值。就像..。
'2009.txt‘141205
'20.txt‘43201
我另外尝试了这段代码
for results in num:
print results但它只显示'have',''200.txt'...未显示FreqDist编号。
另外,我还尝试了nltk.ConditionalFreqDist()..这需要永远..。
我不知道为什么..请帮帮我。我花了差不多4-5个小时来处理这个问题。
提前谢谢你。
发布于 2011-12-19 21:39:56
我对NLTK并不熟悉,但是您似乎正在遍历一个类似于dict的对象。
那这个呢?
for file, n in num.iteritems():
print file, nhttps://stackoverflow.com/questions/8562079
复制相似问题