我对意大利语选区解析器感兴趣。在https://stanfordnlp.github.io/stanza/constituency.html中,据说一个新版本的更新模型(包括一个在都灵树岸上受过训练的意大利型号)应该在11月中旬上市。知道下一节什么时候发行吗?谢谢阿尔贝托
发布于 2021-12-16 22:35:05
技术上说你已经可以得到它了!如果安装了节的dev分支,应该可以下载IT解析器。
pip install git+git://github.com/stanfordnlp/stanza.git@704d90df2418ee199d83c92c16de180aacccf5c0
stanza.download("it")它是在都灵树岸上训练的,那里有大约4000棵树。如果您下载该模型的Bert版本,它在Evalita测试集上将获得超过91 F1 (但长度限制为每句约200个单词)。
我们可能会大手大脚地去买维特树桩之类的东西。我一直在鼓动我们用丹麦语、PT或其他语言的预算,因为我们的用户很少,但这很难推销.
编辑:还有一些脚本用于将公开可用的都灵树转换为括号。他们的MWT注释风格是连续重复MWT两次,这对于像解析原始文本这样的任务不太好。
发布于 2021-12-16 18:44:36
它仍然是一个活的任务..。我想说的是,无论是十二月还是一月。
附注:这其实不是个好问题.
https://stackoverflow.com/questions/70351073
复制相似问题