从URL中提取3个与其相关的标签的最佳方法是什么?
例如:给定http://david.heinemeierhansson.com/2014/tdd-is-dead-long-live-testing.html
结果可能是:
Test-driven-development: 0.7
Rails: 0.2
Programming: 0.1附注:
1)它适用于Rails应用程序。所以,好的答案应该包括一个API请求,或者一个可以做到这一点的Ruby Gem。
2)相关性并不是真的需要标准化(总和为1)
发布于 2014-06-15 02:54:41
您可以对http://psiexp.ss.uci.edu/research/programs_data/toolbox.htm的内容进行主题建模
https://stackoverflow.com/questions/24222380
复制相似问题