首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >将hashtag分类为主题或类别。示例:#FIFA -> SPORTS,VIDEO_GAMES

将hashtag分类为主题或类别。示例:#FIFA -> SPORTS,VIDEO_GAMES
EN

Stack Overflow用户
提问于 2012-08-19 01:11:59
回答 1查看 780关注 0票数 2

是否有一个公共API或Java库可以将Twitter标签从有限的集合中分类到一个主题/类别中。

我需要找到每个twitter帖子的主题基于他们的标签。例如:

/#FIFA12会将这篇文章归类为视频游戏/游戏或娱乐等。

EN

回答 1

Stack Overflow用户

发布于 2012-08-21 07:40:01

我不知道有什么API可以做到这一点,但一种方法是查看映射到维基百科标题的标签。例如,在维基百科中有一个"FIFA12“标题(重定向到一个不同的页面)。除非有歧义的字符串,否则您应该能够将大量的标签映射到Wikipedia标题。

一旦有了标题,您就可以遍历Wikipedia图并获得父子类别关系。例如,FIFA12在维基百科中被归类为以下类别。

代码语言:javascript
复制
2011 video games
Electronic Arts games
EA Sports games
PlayStation 2 games
PlayStation 3 games
PlayStation Portable games
IOS games
Xbox 360 games
Wii games
Nintendo 3DS games
Windows games
Video games developed in Canada
Association football video games
Sports video games with career mode
Video games set in 2011 

这些类别中的每个类别都将有更多的父级。例如,"2011电子游戏“的父母

代码语言:javascript
复制
2011 works
21st-century video games
2011 in video gaming
2011 software

您可以在广度优先搜索的每个级别上使用“多数投票”和阈值(比如2+),以减少需要分析的节点数量。在某种程度上,你可以想出一个启发式方法来停止。例如,类别“视频游戏”与FIFA12相距三跳,并且可以通过不止一条路径到达。想出最优的启发式方法并不是一件容易的事,但这里有一些容易摘到的果实。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/12020580

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档