首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >使用Tweepy根据语言过滤推文

使用Tweepy根据语言过滤推文
EN

Stack Overflow用户
提问于 2012-10-15 07:41:56
回答 1查看 2.4K关注 0票数 0

我使用tweepy为一个项目流式传输和捕获关于名人的推文,并意识到一半的数据不是英文的(我现在需要用英文进行分析)。那么,有没有一种方法可以根据推文的语言过滤流媒体,或者以某种方式提供类似的过滤?

EN

回答 1

Stack Overflow用户

发布于 2012-10-17 19:27:27

不幸的是,流数据不包括ISO语言代码,所以我认为唯一的方法就是直接检测语言(this answer可能会有所帮助)。根据您正在传输的数据量,您可能希望首先存储数据,然后使用第二个进程来检测语言并丢弃所有不需要的语言。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/12887616

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档