我的HTML代码是
<tr>
<td colspan="8" class="text">
<B>Total</B>:
</td>
<td class="text">
<b> 1 GB</b>
</td>
<td class="text">
<b> 1.8 GB</b>
</td>
</tr>现在,我想要获取td标记中具有class="text“的数据。
在python中,我会这样做:
historySoup = BeautifulSoup(html)
table = historySoup.find('td', attrs={
"colspan": "8",
"class": "text"
}).parent
tds = table.findAll('td')
puts(tds[1].text)
puts(tds[2].text)但我坚持使用安吉利夏普。我试过了:
var parser = new HtmlParser();
var document = parser.Parse(myhtml);
var blueListItemsCssSelector = document.QuerySelectorAll("td[colspan = '3']");
foreach (var item in blueListItemsCssSelector)
{
item.GetElementsByClassName("text");
var x = item.Text();
}但是我只是获得x中的文本总数,然后循环ends.Any知道如何访问tr的内部td标记并将它们的文本存储在列表或数组中?此外,解析任何其他更快的方法都需要时间,因为我的html包含200多个td标记。
https://stackoverflow.com/questions/41629501
复制相似问题