我有有文章和合著者的科学数据库。使用这个数据库,我正在对合著者的word2vec模型进行培训。
这里的用例是为了消除作者的歧义。
我想知道我在这里的方法是否能得到改进,或者任何建议都会受到极大的赞赏。
发布于 2021-07-13 00:30:12
您可能不需要使用word2vec来消除作者的歧义。使用正则表达式解析名称然后进行web搜索可能是有效的。
如果您确实希望培训word2vec来消除作者的歧义,最好嵌入所有可能的信息(例如,作者、标题、期刊、摘要、.)。
https://datascience.stackexchange.com/questions/11771
复制相似问题