还有另一个英语维基词典解析问题。
总的来说,我已经准备好解析wikitext格式,所以标准API适合我。
问题是,我想使用英语Wiktionary API来获取解密表。出于某种奇怪的原因,这些表被代码引用。有时,它们在输出中,但在大多数情况下,它们都会丢失。例如,调用像http://en.wiktionary.org/w/api.php?format=xml&action=query&titles=крот&rvprop=content&prop=revisions&redirects=1这样的俄语单词会产生如下结果:
====Declension====
{{ru-noun-table|b|a=an}}如何将其转换为完整的加密表?
我在这里使用了一堆参数:https://www.mediawiki.org/wiki/API:Query -无结果。
我发现的一个解决办法是使用新的Wiktionary API,就像这样:https://en.wiktionary.org/api/rest_v1/page/html/крот (参考:https://en.wiktionary.org/api/rest_v1/#/)。但是它只返回HTML,这更难解析!
这就是我们能做的最好的事情了吗?
是不是有一个特殊的调用来调用加密表呢?我是说,如果它产生了,肯定有办法。
发布于 2020-07-19 15:12:30
该表是由维基词典的Module生成的,即Module:ru-noun,这是一个lua脚本。它的功能类似于常规的mediawiki模板调用,脚本使用参数(b,a=an)进行上下文设置,并可以访问页面名称(крот)。
请参阅"Wikinflection: Massive semi-supervised generation of multilingual inflectional corpus from Wiktionary“,了解这背后的rational,然后查看生成的Dictionary builder project。
https://stackoverflow.com/questions/62955402
复制相似问题