编写一个可以验证HTML模块的最佳方法是什么,尤其是使用嵌入式RDFa?我熟悉validator.w3.org,我对编写一个自定义验证器很感兴趣,该验证器可以执行类似的功能,但是使用RDFa作为元素元数据的不同标准。有哪些好的源代码需要查看,有哪些Python库需要尝试,有哪些需要牢记?
发布于 2012-06-22 18:15:13
埃米特
我不确定你想要实现什么。我确实用Python语言编写了一个RDFa蒸馏器。您必须问的第一个问题是,您想考虑XHTML还是HTML5。如果是前者,周围有很多XML环境,还有用于RDFa的DTD-s。这可能行得通。对于HTML5,您可能想要使用HTML5 parser in Python,但是它并不“了解”RDFa,但是它可以生成一个DOM树(或其他表示),然后您可以使用它来检查RDFa属性。但是,请注意,HTML5解析器并不执行针对各种可能的错误条件分析HTML5代码的“验证”;它只是根据HTML5规范生成一个DOM树。
我希望这能帮到你。
干杯
伊万
https://stackoverflow.com/questions/11146520
复制相似问题