我正在使用twarc2检索tweet。返回的jsonl文件有以下键:
dict_keys(['text', 'conversation_id', 'entities', 'author_id', 'public_metrics', 'source', 'id', 'reply_settings', 'edit_history_tweet_ids', 'created_at', 'possibly_sensitive', 'lang', 'referenced_tweets', 'author', '__twarc'])当我检查data[0]['text']的值时,它以...结尾,如下所示:
RT @Weather_West: "You may have heard that we have 12 years to fix everything. This is well-meaning nonsense, but it’s still nonsense. We h…我想知道怎样才能得到这条推特的全文。显然,twarc2甚至不返回retweeted_status,不像以前帮助检索全文的tweepy。
发布于 2022-10-01 21:15:12
实际上,twarc2 csv自动扩展了推特。因此,我们可以先转换为.jsonl,然后才能从tweet访问全文,而不是使用.csv。
https://stackoverflow.com/questions/73921721
复制相似问题