如果有以下html:
</br></td>, <td class="first">TEXT_1a<br>TEXT_1b
</br></td>, <td class="first">TEXT_2a<br>TEXT_2b
</br></td>, <td class="first">TEXT_3a<br>TEXT_3b
</br></td>, <td class="first">TEXT_4a<br>TEXT_4b
</br></td>, <td class="first">TEXT_5a<br>TEXT_5b
</br></td>, <td class="first">TEXT_6a<br>TEXT_6b我用过
[i.text.strip() for i in soup.select('td.first')]霍弗,然后我
['TEXT_1aTEXT_1b', 'TEXT_2aTEXT_2b', 'TEXT_3aTEXT_3b', 'TEXT_4aTEXT_4b', 'TEXT_5aTEXT_5b', 'TEXT_6aTEXT_6b']如何删除TEXT_1b,TEXT_2b...TEXT_nb。此外,我不想有一个数组,但是N1 = TEXT_1a,N2 = TEXT_2a...Nn = TEXT_na
发布于 2015-06-30 09:38:55
我想你可以用:
[i.contents[0].strip() for i in soup.select('td.first')]关于你问题的第二部分--你想要在单个变量中有字段吗?你能做到,但这可能不是个好主意。有理由这么做吗?
或者,您知道其中有多少,在这种情况下,您可以这样做:
n1, n2, n3, ...nN = [i.contents[0].strip() for i in soup.select('td.first')]或者您没有,在这种情况下,数组(列表,在python中)确实是唯一有意义的东西。
https://stackoverflow.com/questions/31134544
复制相似问题