首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >基于tweepy的文本挖掘

基于tweepy的文本挖掘
EN

Stack Overflow用户
提问于 2015-05-22 19:53:03
回答 1查看 572关注 0票数 0

我已经使用tweepy收集了tweet,并且标记了它们并删除了停止词,但是当我使用json加载它们时,它会抛出以下错误

代码语言:javascript
复制
"File "C:\Python27\Projects\kik.py", line 26, in <module>
    tweet = json.loads(tokens)
  File "C:\Python27\lib\json\__init__.py", line 338, in loads
    return _default_decoder.decode(s)
  File "C:\Python27\lib\json\decoder.py", line 366, in decode
    obj, end = self.raw_decode(s, idx=_w(s, 0).end())
TypeError: expected string or buffer" 

请帮帮我。

代码语言:javascript
复制
tweets_data_path = 'c:\\Python27\\Projects\\newstweets.txt'
stopset = set(stopwords.words('english'))

tweets_data = []
tweets_file = open(tweets_data_path, "r")
text = tweets_file.read()
tokens=word_tokenize(str(text))
tokens = [w for w in tokens if not w in stopset]
tweet = json.loads(tokens)
tweets_data.append(tweet)
EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2015-05-22 21:03:55

json.loads需要一个字符串,您正在尝试加载一个列表。

而不是:

代码语言:javascript
复制
tokens = [w for w in tokens if not w in stopset]

尝试:

代码语言:javascript
复制
tokens = str([w for w in tokens if not w in stopset])
票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/30404885

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档