我们正在考虑使用现有的内容分析服务API来返回本文中给定的术语关联评分。
找到了一些非常好的内容分析服务,如:
然而,我们正在寻找一种方法来返回给定的术语相关性评分。
例如,
我们有一个词汇-主题包含“成本”,“政府”。
和一个页面http://www.test.dev/article/1.html
然后,我们希望使用内容分析服务来检查文章中主题的相关性。
所以我们可以决定用我们自己的词汇表自动标记这篇文章。
谢谢你的帮助。
发布于 2012-12-19 19:58:38
您提到的雅虎内容分析服务对于识别相关链接和其他元数据非常有用。如果您是专门寻找词汇术语,您可以尝试雅虎术语抽取服务。它接受源文本和查询术语。
下面是演示查询,如YQL控制台中所示:
select * from search.termextract where context="Italian sculptors and painters of the renaissance favored the Virgin Mary for inspiration" and query="madonna"
和抽样结果:
"results": {
"Result": [
"Italian sculptors",
"the Virgin Mary",
"painters",
"the renaissance"
]
}一个很大的警告是:雅虎已经表示,该术语的提取服务将在某一时刻被关闭。相反,他们正在推荐新的开发,使用内容分析服务。(来源)
如果您想要在相同的上下文中尝试该服务的结果,也有用于OpenCalais的YQL表。
https://stackoverflow.com/questions/13214997
复制相似问题