我试着用这种漂亮的汤打印html:
load = urllib2.urlopen(url)
soup = BeautifulSoup(load, 'lxml')
characteristics = soup.find('table', { 'class' : 'characteristics-table'})
print characteristics拿着这个:
<table class="characteristics-table">
<tr class="characteristics alt">
<td class="name">
Zīmols
</td>
<td>
Emporio Armani</td>
</tr>
<tr class="characteristics">
<td class="name">
<b>Mehānisma tips</b>
</td>
<td>
<b>Mehāniskie automātiskie</b></td>
</tr>...但需要这样的东西:
<table class="characteristics-table"><tr class="characteristics alt"><td class="name">Zīmols</td><td>...该怎么做呢?
发布于 2017-10-28 02:51:27
''.join(characteristics.split('\n')) #or \r\n on Windows发布于 2017-10-28 02:46:16
如果您只想删除characteristics中的换行符,那么使用str.replace删除它们,方法是用空字符串''替换换行符。
print str(characteristics).replace('\n', '').replace('\r\n', '')第一个替换unix样式的换行符,第二个换行符应用于第一个换行符的结果,替换windows样式的换行符。
编辑:.replace必须应用于从美丽汤的查找返回的obj的str()。
https://stackoverflow.com/questions/46985645
复制相似问题