我正在使用pyquery构建一个网页:
> page = PyQuery('<html><head><script type="text/javascript" src="jquery-1.4.min.js"></script><script type="text/javascript" src="tools.min.js"></script></head><body></body></html>')
> print page
Output: <html><head><script type="text/javascript" src="jquery-1.4.min.js"/><script type="text/javascript" src="tools.min.js"/></head><body/></html>然而,脚本(和主体)标签不应该是这样结束的。Firefox会忽略头的其余部分。
我试着将上面的内容分解成单个元素(即一次添加一个脚本标签),但无济于事:
> page = PyQuery('<html><head></head></html>')
> page.find('head').append('<script type="text/javascript" src="jquery-1.4.min.js"/></script>')
> page.find('head').append('<script type="text/javascript" src="tools.min.js"></script>')
Output: <html><head><script type="text/javascript" src="jquery-1.4.min.js"/><script type="text/javascript" src="tools.min.js"/></head><body/></html>同样的事情也发生在<iframe/>标签上(因为youtube而被迫使用这些标签),它们不会被火狐关闭,所有进行中的代码都会被忽略。
我如何才能强制pyquery使用单独的关闭标记来关闭它们,因为我相信,这是符合html标准的。
哦,如果有人想知道,我没有做所有的美丽汤,因为(1)我得到美丽的汤错误和(2)它是一个弃用的包,作者停止支持它大约一年或两年前。
发布于 2011-08-02 09:30:54
尝试:
page = PyQuery('<html><head><script type="text/javascript" src="jquery-1.4.min.js">\n</script><script type="text/javascript" src="tools.min.js">\n</script></head><body></body></html>')它也适用于iframe。
发布于 2012-11-02 21:08:30
您应该使用print page.__html__()转储html,或者更好的方法是转储print page.html(method='html')
https://stackoverflow.com/questions/5043629
复制相似问题