首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >Sgml返回一些警告

Sgml返回一些警告
EN

Stack Overflow用户
提问于 2013-10-04 09:39:59
回答 1查看 48关注 0票数 2

我使用prolog的sgml库来提取有关网页的信息。我使用此指令提取所有:

代码语言:javascript
复制
load_structure('file.html', List, [dialect(sgml), shorttag(false), max_errors(-1)])

系统加载页面,但我有一些警告,例如:

代码语言:javascript
复制
WARNING:SGML2PL(sgml): inserted omitted end-tag for "img"
WARNING:SGML2PL(sgml): inserted omitted end-tag for "br"
WARNING:SGML2PL(sgml): entity "amp" does not exist

怎样才能消除这些警告呢?

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2013-10-04 10:01:06

我使用这个语法

代码语言:javascript
复制
get_html_file(FileOrStream, P) :-
        dtd(html, DTD),
        load_structure(FileOrStream, [P],
                       [ dtd(DTD),
                         dialect(sgml),
                         shorttag(false),
                         syntax_errors(quiet),
                         max_errors(-1)
                       ]).

syntax_errors(quiet)应该做的选择。

我记得我很难用错误来解析旧页面。错误处理可能很复杂,一些像标签汤这样的工具更宽容,可以帮助获得工作.

票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/19178056

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档