我很清楚用正则表达式解析HTML有很多警告和强烈的反对者。因此,我并不是试图重新发明轮子,而是在寻找一种工具,它可以让我指向一个网页,然后说“给我获取评论,废话”。
有谁能给点建议吗?
我正在阅读一些OWASP文档或安全博客,我几乎可以肯定我看到了一个执行此任务的工具。不幸的是,谷歌一直没有提供任何帮助。
干杯
发布于 2010-10-22 20:20:31
如果您想要一个RemarkNode解决方案,请尝试HTMLParser并查找Java s。
发布于 2010-10-23 05:34:56
嗯……我认为用你使用的操作系统和一些聪明的关键字在谷歌上搜索一下,就能得到你想要的一切。对于基于UNIX的系统,请查看:parse HTML with SED and PERL
对于Windows,我认为你可以用VBS (VBScript)搜索一些东西。
https://stackoverflow.com/questions/3996636
复制相似问题