我正在使用Ipython,通过库Twython,我能够使用用户名获取tweet。是否可以分析影响力度量(例如,我正在检索其推文的人的影响力有多大),或者推文的影响是什么
谢谢
发布于 2013-01-02 23:55:13
对你的问题的简短回答是,是的,你当然可以通过Twitter数据以某种方式衡量影响力。另一方面,您可能应该考虑如何将影响力理解为指标,这与您的数据有何关系,以及您将如何衡量数据中的影响力。
以下是你可能会考虑的一些事情:
1.)除了拉入单个用户的tweet之外,您可能还想拉入他们的个人资料信息(例如,关注者数量、tweet总数等)。通过将此数据与来自Tweets的元数据相结合,您将有更多的数据可用。
2.)考虑在每个人的基础上查看以下一些数据点:
转发的推文分享:假设你为一个人拉了1000条推文;你可以确定这些推文被转发的百分比(例如,这些推文对其他人的影响有多大)#每条转发的推文:当一个人被转发时,只有一个或两个人转发了他/她的推文,或者是hudnreds?
3.)你也应该考虑话题的相关性。如果某人在Twitter上被转发了很多,并且有大量的追随者,这是因为与他们的职业相关的推文,还是因为他们写了关于猫的文章?根据您的用例和业务逻辑,这些类型的问题可能很关键。
这些只是一些起点。我会花一些时间查看Twitter REST API 1.1文档和Twython文档,以便您更好地了解哪些数据点可用,然后考虑这些数据点对您的影响力度量有何贡献。
祝好运。
编辑如果我理解正确的话,vishal1985,在你的评论中,你问的是如何使用来收集关于转发的信息。这可能意味着几件事中的一件,但我认为你问的是如何获得我列出的一些数据点(例如,上面的“转发的推文份额”)。
在这里,我再一次向您推荐Twython和Twitter API Documentation,如果您打算大量使用此类数据,那么您真的应该了解它们。但为了给你指出正确的方向,这里是你如何确定一个作者的原创推文被其他人转发的百分比。
from twython import Twython
from __future__ import division #assuming you're using Python 2.X
t = Twython(app_key='...',
app_secret='...',
oauth_token = '...',
oauth_token_secret = '...') #supply your credentials for each of these
tweets = t.getUserTimeline(screen_name='justinbieber', include_retweets=False) #see note below
retweeted_tweets = 0
for tweet in tweets:
if tweet['retweet_count']> 0: #...if at least one person has retweeted the tweet
retweeted_tweets += 1
share_tweets_retweeted = retweeted_tweets/len(tweets)
#e.g., #number retweeted divided by total number of sampled tweets这些步骤所做的是将出现在用户时间线中的最多200条推文拉进来。include_retweets=False部分可能看起来令人困惑,但它是必要的。这样做的目的是排除你感兴趣的作者(在这里是贾斯汀·比伯)转发的其他人写的推文,因为你想知道的是有多少人在你的作者写原创内容时转发了他或她。我们迭代用户的时间线,并确定他们的推文被至少一个人转发的数量。然后我们将其除以采样推文的总数,这就得到了转发的份额。
请注意,这没有考虑分页(例如,在一个时间轴的多个页面中导航--一次只能从一个时间轴请求200条tweet,最多可达5000条),这是您可能希望实现的功能。希望这能有所帮助。
https://stackoverflow.com/questions/14121195
复制相似问题