问使用Twint时的推文抓取
EN

Stack Overflow用户

提问于 2021-09-20 09:00:35

回答 1查看 332关注 0票数 1

我正在做一些关于推文的情感分析的研究。我一直在使用twint从一些我收到更多推文的城市抓取推文。当我将从2010年到2015年的5年时间里为同一个标签收集全世界的推文进行比较时。我不能理解为什么twint会这样做。下面是我的代码：

import twint
import pandas as pd
import nest_asyncio
nest_asyncio.apply()

cities=['Hyderabad','Mumbai','Kolkata','Vijayawada', 'Warangal', 'Visakhapatnam']
unique_cities=set(cities) #To get unique cities of country
cities = sorted(unique_cities) #Sort & convert datatype to list
for city in cities:
    print(city)
    config = twint.Config()
    config.Search = "#MarutiSuzuki"
    config.Lang = "en"
    config.Near = city
    config.Limit = 1000000
    config.Since = "2010–01–01"
    config.Until = "2015–12–01"
    config.Store_csv = True
    config.Output = "my_finding.csv"
    twint.run.Search(config)`

twint

python

web-scraping

twitter

sentiment-analysis

回答 1

Stack Overflow用户

发布于 2021-09-20 14:44:38

也许Twitter在全球搜索时对显示推文数量有限制，例如，它只显示X个条目，但当你根据位置更具体地缩小搜索范围时，它会显示该区域的最大数量。例如，亚马逊将只显示400页的搜索项目，即使可能有更多，同样，如果您指定详细信息，它可能会显示比前一次搜索更多的项目。

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/69251683

复制

相似问题

问使用Twint时的推文抓取
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问使用Twint时的推文抓取EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问使用Twint时的推文抓取
EN