我正在尝试创建一个类别中所有子类别的列表,以及所有这些子类别的基本类别信息。(文件数、子类别等)
我已经很接近了--只是在处理continue过程上挂起了手。
这会得到前100个结果:
http://en.wikipedia.org/w/api.php?action=query&format=xml&generator=categorymembers&gcmtitle=Category:Google%20Art%20Project%20works%20by%20artist&gcmlimit=100&gcmprop=ids|title&prop=categoryinfo&continue=
但是,有成千上万的子类别。
结果包括一个具有gcmcontinue和continue属性的xml节点continue。
如果我在第二个请求中使用它,就会得到下一个100个结果:
http://en.wikipedia.org/w/api.php?action=query&format=xml&generator=categorymembers&gcmtitle=Category:Google%20Art%20Project%20works%20by%20artist&gcmlimit=100&gcmprop=ids|title&prop=categoryinfo&continue=gcmcontinue||&gcmcontinue=subcat|4c41555245c380204241525241550a474f4f474c45204152542050524f4a45435420574f524b53204259204c41555245c38020424152524155|38370707
但是,这就是我遇到问题的地方。这些(第二个)结果集不再有continue xml节点,因此我不确定如何访问第三个页面等等。
(顺便说一句,我知道如果我想这样做-我必须处理子-子类别-但我不需要这些,只需要第一个级别就可以了。)
发布于 2015-04-28 07:44:44
詹姆斯自己的答案:所以,如果你想要来自commons的结果,那么确保你点击"commons.wikimedia.org“而不是"en.wikipedia.org”是很有帮助的!这就是问题所在。
https://stackoverflow.com/questions/24092312
复制相似问题