我使用ConceptNet http://conceptnet.io来尝试使用相关关键字和边缘/查询端点来获取相关关键字。数据很棒,但是我遇到了一些我搞不懂的行为。
如果您在主站点上查询关键字"person“的"relatedto”(限制为20 ),您将得到:
http://conceptnet.io/c/en/person?rel=/r/RelatedTo&limit=20
或者这个单词列表:
doll
character
statue
person
servant
body
farmer
child
man
baby
guard
name
doctor
captain
people
neighbour
boy很棒对吧?这是非常贴切而且有用的。
另一方面,如果您使用与API格式相同的查询查询API:
http://api.conceptnet.io/related/c/en/person?filter=/c/en&limit=20
为清晰起见缩短了篇幅(完整答复见上面的链接):
{
"@id": "/c/en/person",
"related": [
{
"@id": "/c/en/person",
"weight": 1.0
},
{
"@id": "/c/en/sean_connery",
"weight": 0.963
},
{
"@id": "/c/en/steve_ballmer",
"weight": 0.962
},
{
"@id": "/c/en/norman_jewison",
"weight": 0.962
},
{
"@id": "/c/en/aretha_franklin",
"weight": 0.962
}
]
}哈。那里发生了什么?那就没什么用了。我们只知道名字和不太相关的术语。
,所以我的问题是:我如何得到类似的列表?
他们是否使用复杂的边缘分析(使用标准,而不是查询)来获取网站上的相关术语?
或
我是不是错过了一些我搞不懂的东西?
任何帮助都很感激。
谢谢
发布于 2019-03-11 19:13:53
若要查询带有/r/RelatedTo标记的包含节点/c/en/person的现有边缘,应查询:http://api.conceptnet.io/query?node=/c/en/person&rel=/r/RelatedTo
该查询的结果与网站匹配。
/related端点是不同的,并且只存在于API中。它应用一些机器学习来预测相关节点,无论连接它们的边缘是否已经存在于ConceptNet中。更具体的概念比“人”更好。尝试“教师”,例如:http://api.conceptnet.io/related/c/en/teacher?filter=/c/en&limit=20
https://stackoverflow.com/questions/55064818
复制相似问题