我使用带有搜索词的twarc2检索tweet,方式如下:
twarc2 search --archive --start-time "2015-01-01" --end-time "2018-12-31" --limit 25000 "faith OR #faith" results.jsonl但是得到的tweet在一定长度后被截断。RT @AndrewYNg: We cannot abdicate responsibility when two children, ages 7 and 8, die in US custody. The US once said: "Give me your tired,…虽然推特长了一点。我阅读了twarc2文档,但找不到检索full_text的任何"extended" tweet_mode选项。如对此有任何帮助,将不胜感激。
发布于 2022-03-30 17:28:13
是否所有检索的tweet都被截断了?您提供的示例是一个retweet (包括"RT")。RT被截断,但它们的原始tweet是全文。
您可以在twarc2中排除转发。尝试将以下内容添加到命令中:
-is:retweet 希望这能有所帮助。
https://stackoverflow.com/questions/71652963
复制相似问题