我正在使用lxml.html.cleaner从输入文本中清除html。如何在lxml.html中将\n更改为<br />?
发布于 2010-10-15 03:45:07
相当简单,稍微有点老生常谈的方式:假设您已经使用lxml.html.parse或任何一种方法构建DOM,您可以将其作为两步过程的一部分来完成。
iterdescendants方法,它按照普通的遍历you.
lxml.html.clean的所有内容一种更复杂的方法是用猴子补丁lxml.html.clean模块。与许多lxml不同的是,这个模块是用Python语言编写的,非常容易访问。例如,当前有一个_substitute_whitespace函数。
https://stackoverflow.com/questions/3936754
复制相似问题