如何使用Wiktionary的API来确定一个单词是否存在?
发布于 2010-05-05 12:08:51
Wiktionary API可以用来查询一个单词是否存在。
现有页面和非现有页面的示例:
http://en.wiktionary.org/w/api.php?action=query&titles=testhttp://en.wiktionary.org/w/api.php?action=query&titles=testx
第一个链接提供了其他类型的格式的示例,这些格式可能更容易解析。
要以较小的XHTML格式检索word的数据(如果需要更多),请请求页面的可打印版本:
http://en.wiktionary.org/w/index.php?title=test&printable=yeshttp://en.wiktionary.org/w/index.php?title=testx&printable=yes
然后,可以使用任何标准的XML解析器对它们进行解析。
发布于 2010-12-03 13:35:29
在检查Wiktionary是否有您要查找的名称的页面时,有几点需要注意:
警告#1:包括英语维基词典在内的所有维基词典实际上都有包含每种语言中的每一个单词的目标,所以如果你简单地使用上面的API调用,你就会知道你询问的单词至少有一种语言的单词,但不一定是英语:http://en.wiktionary.org/w/api.php?action=query&titles=dicare
警告#2:可能存在从一个单词到另一个单词的重定向。它可能来自另一种拼写,但也可能来自某种错误。上面API调用不会区分重定向和文章:http://en.wiktionary.org/w/api.php?action=query&titles=profilemetry
警告#3:包括英语维基词典在内的一些维基词典包括“常见的拼写错误”:http://en.wiktionary.org/w/api.php?action=query&titles=fourty
警告#4:一些维基百科允许存根条目,这些存根条目很少或根本没有关于该术语的信息。这曾经在几个维基百科上很常见,但在英语维基词典上就不常见了。但现在它似乎也扩展到了英语维基词典:https://en.wiktionary.org/wiki/%E6%99%B6%E7%90%83 (当存根被填满时的永久链接,这样你仍然可以看到存根的样子:https://en.wiktionary.org/w/index.php?title=%E6%99%B6%E7%90%83&oldid=39757161)
如果这些内容没有包含在您想要的内容中,您将不得不加载和解析wikitext本身,这不是一项微不足道的任务。
发布于 2011-08-18 16:15:18
您可以下载Wiktionary data的转储文件。在FAQ中有更多信息。就您的目的而言,definitions dump可能是比XML dump更好的选择。
https://stackoverflow.com/questions/2770547
复制相似问题