让我们考虑一下以下案文:
约翰约瑟夫住在美国,他在联邦政府工作
在本文中,我得到了以下实体的提及:
John JosephAmericaHeFederal government现在我试图得到每个实体提到的概率值。当我查看Java APIs时,我注意到我们可以得到每个令牌的概率值(约翰、约瑟夫、美国、他、联邦和政府)。
但是,我们如何得到“约翰·约瑟夫”和“联邦政府”(不止一个令牌)的概率值?是否有任何Java可用于获取此值?
任何帮助都将不胜感激。
发布于 2018-09-13 03:26:07
我们将在斯坦福大学CoreNLP 3.9.2中添加一个新特性,它为实体附加最小标记概率。不过,我们不会提供任何通过规则得到的分数,因为我们不清楚什么样的信心是合适的。例如,"Joe“可能得到"Joe”令牌用于PERSON的概率。这似乎是一种合理的启发。
我们的目标是这个新版本将在月底前发布!发布后,我将用更多的细节更新这个答案。
https://stackoverflow.com/questions/52299938
复制相似问题