我在学习python爬行时遇到了以下问题:
from bs4 import BeautifulSoup
import requests
url = 'http://www.zhipin.com/job_detail/1411924978.html'
result = requests.get(url)
soup = BeautifulSoup(result.text,'lxml').select('#main > div.job-banner > div > div > div.info-company > p')
print(soup[1])
print(soup[1].get_text())结果是:
<p>IT软件<em class="vline"></em>已上市<em class="vline"></em>10000人以上</p>
IT软件已上市10000人以上但是我想要的print(soup[1].get_text())是这样的:
IT软件 已上市 10000人以上
或
IT软件
已上市
10000人以上我该怎么写密码?
太感谢了!
发布于 2017-06-08 15:24:43
你可以试试:
print soup[1].getText(separator=u' ') # space separator
print soup[1].getText(separator=u'\n') # newline separator产出如下:
>>> print soup[1].getText(separator=u' ')
IT软件 已上市 10000人以上
>>> print soup[1].getText(separator=u'\n')
IT软件
已上市
10000人以上资料来源:another SO answer =>在问问题之前请先研究一下你的问题。
https://stackoverflow.com/questions/44439576
复制相似问题