首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何在python中从每一行csv文件中提取单词?

如何在python中从每一行csv文件中提取单词?
EN

Stack Overflow用户
提问于 2015-06-03 11:35:12
回答 1查看 2.1K关注 0票数 0

我有一个非常大的.csv文件(1065行x 1列)。每行都有句子。我想从我的词表(.csv文件)中提取每一行中的几个重要单词,然后为每一行设置数据词频。

EN

回答 1

Stack Overflow用户

发布于 2015-06-04 13:14:28

我刚刚试着写下一些东西,希望这能对你有所帮助。它可能可以更高效地完成,但它已经完成了这项工作。

输入文件示例

代码语言:javascript
复制
bla bla bla. bla! bla bla apple!, :banana. apple!!!
banana bla bla, apple and banana
peach 12345 bla bla peach and banana, peach, banana! :apple

代码

代码语言:javascript
复制
# Your inputs
list_words = ['apple', 'banana','peach']
filename = 'example.txt'

# Set of characters to remove to tokenize the file's line
rm = ",:;?/-!."

# Read through the file per each line and do the math
with open(filename,'r') as fin:
    for count_line, line in enumerate(fin,1):
        clean_line = filter(lambda x: not (x in rm), line)
        # To hold the counts of each word
        words_frequency = {key: 0 for key in list_words}
        for w in clean_line.split():
            if w in list_words:
                words_frequency[w] += 1
        print 'Line', count_line,':', words_frequen

输出:

代码语言:javascript
复制
Line 1 : {'apple': 2, 'peach': 0, 'banana': 1}
Line 2 : {'apple': 1, 'peach': 0, 'banana': 2}
Line 3 : {'apple': 1, 'peach': 3, 'banana': 2}
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/30610404

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档