我们正在编写一个演示应用程序,其中我们使用了谷歌的云语音API和自然语言API。我们把它用于电视机和机顶盒的语音控制。
总的来说,我必须说,这些API运行得很好。
然而,我们想知道是否可以定制自然语言API,以便在我们的行业中更加具体。
更具体地说,我们对传递给特定实体的显着性评分有问题。
例如,将以下文本数据传递给Google:“向我展示像Zoolander这样的电影。”
给出了以下结果:
实体名称\ Entity类型\\元数据\显着性
电影WORK_OF_ART \ {} \{} 0.7970062 Zoolander \ WORK_OF_ART \ {'mid':'/m/01shy7','wikipedia_url':'https://en.wikipedia.org/wiki/Zoolander'} \x{ 0.20299383
虽然Zoolander是句子中最重要的实体,但它的显着性很低。
有什么办法可以改进吗?或者还有其他可以定制的自然语言API吗?
发布于 2018-07-02 13:18:14
我正在评估,我找不到任何东西来定制上下文.所以看来这是不可能的:
发布于 2018-07-07 15:44:19
由于Google使用自己的数据来训练机器学习模型,所以没有任何方法来改进API结果,也没有任何选择来定制它。
拥有自定义模型的唯一方法是自己训练它,例如使用AutoML。但这需要很大的努力。
您可以根据上下文(或者我可以帮您)提交一个特征请求来对结果进行“条件化”,这可能会以某种方式影响显着性分数,而不是只考虑文本上的相关性这个词。
无论如何,这可能不是必要的,因为我看到了第一个和第二个结果之间的一个重要的显著差异。您试过使用salience scores差异而不是salience absolute value吗?还是结果特定“类型”的分数乘数(本例中为WORK_OF_ART)?
我知道,这个解决方案可能适用于某些类型的句子,但不适用于其他句子。
https://stackoverflow.com/questions/45595579
复制相似问题