首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >维基百科API忽略引用错误或脚注

维基百科API忽略引用错误或脚注
EN

Stack Overflow用户
提问于 2012-12-30 21:37:06
回答 1查看 241关注 0票数 0

我提出这个要求:

代码语言:javascript
复制
http://en.wikipedia.org/w/api.php?format=xml&action=query&titles=self-administration&prop=revisions&rvprop=content&rvparse=&rvsection=0

我的目标是从一篇文章的介绍中获得纯文本。

它给出了XML文件中的一些HTML。在strip_tagspreg_replace,删除引用之后,我得到以下内容:

在医学意义上,自我管理是一个主体向他、她或其自身服用一种药理学物质的过程。..。引号错误:此页上有标记,但如果没有{{Reflist}模板或标记,引用将不会显示;请参阅帮助页。

我想移除

引号错误:此页上有标记,但如果没有{{Reflist}模板或标记,引用将不会显示;请参阅帮助页。

我怎样才能使用php (preg_replace?)或者在我最初的查询中(忽略错误?)。

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2012-12-30 21:47:38

代码语言:javascript
复制
$bad = ' <br /><strong class="error">Cite error: There are <code>&lt;ref&gt;</code> tags on this page, but the references will not show without a <code>&#123;&#123;Reflist&#125;&#125;</code> template or a <code>&lt;references /&gt;</code> tag; see the <a href="/wiki/Help:Cite_errors/Cite_error_refs_without_references" title="Help:Cite errors/Cite error refs without references">help page</a>.</strong> ';

$good = str_replace($bad, '', $intro);
票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/14094911

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档