假设我正在根据各种条件从twitter收集tweet,并将这些tweet存储在本地mysql数据库中。我想能够电脑热门话题,如推特,可以在任何地方的长度从1-3个字。
有没有可能写一个脚本来做类似PHP和mysql的事情?
我发现,一旦能够获得术语的计数,我就可以回答如何计算哪些术语是“热门”的,但我被困在了第一部分。我应该如何将数据存储在数据库中,如何统计长度为1-3个单词的术语在数据库中的出现频率?
发布于 2011-04-25 20:46:20
来自我的热门话题接收:
<代码>H19静音一些垃圾单词/短语<代码>H210<代码>G211
可以,您可以在php & mysql;上进行。)
发布于 2010-02-12 05:29:25
如何首先在单个单词标记中分解您的tweet,并计算每个单词的出现次数?一旦有了它们,您就可以分解所有两个单词标记,计算出现的次数,最后对所有三个单词标记执行相同的操作。
你可能还想添加一些你不想统计的单词的字典
发布于 2010-02-12 05:31:40
你需要的是
可能是第二个。只有到那时,你才能及时计算出他们的受欢迎程度。
https://stackoverflow.com/questions/2247663
复制相似问题