我有一个生成的HTML文件,我想在上传到网站之前对它进行审计(每小时都有一个脚本完成)
我想要审计这样的东西:<script>BADTHINGS</script>
我不能使用:
sed -i "s/<script>//g" htmlfile.html因为可能存在以下情况,例如:
<scr<script>ipt>BADTHINGS</scr</script>ipt>你有什么建议?如何审计HTML文件?
PS。htmlfile.html包含新闻链接,例如: slashdot等。<-该文件由脚本生成。
发布于 2011-02-13 23:14:34
使用sed进行多次传递,使用HTMLPurifier。
https://stackoverflow.com/questions/4984870
复制相似问题