根据这个answer
>>> from lxml.html import fromstring
>>> s = """<input type="hidden" name="question" value="1234">"""
>>> doc = fromstring(s)
>>> doc.value
'1234'
>>> doc.name
'question'我试图从下面的代码中获取链接和文本:
from lxml.html import fromstring
s = '<a href="http://a.com" rel="bookmark">bla bla bla</a>'
doc = fromstring(s)
print (doc.href)
print (doc.text_content())它提供了一个AttributeError:'HtmlElement' object has no attribute 'href'
我是lxml中的新成员。到底是什么问题呢?
我如何从这段代码中获得链接(a.com)和文本(bla bla bla)作为字符串?
发布于 2014-12-08 20:11:03
这段代码适用于我
from lxml.html import document_fromstring
doc = document_fromstring('<a href="http://a.com" rel="bookmark">bla bla bla</a>')
print (doc.xpath("//a")[0].get("href"))
print (doc.text_content())输出:
http://a.com
bla bla blahttps://stackoverflow.com/questions/27345122
复制相似问题