我正在使用hpple来解析一些HTML。我使用的是Xcode4.6和iOS 6.1。它看起来像这样。

我可以使用下面的XPathQueryStrings提取文本和图像。
Text ==> //div[@class = 'entry-content']/p
图像==> //div[@class = 'entry-content']//img/@src
然而,我也需要获得接近底部的文本“退休邮票集PDF”。此文本会更改,但格式通常是相同的。我尝试了下面的路径,
div[@class = 'entry-content']//a[@title]//text()
但这并不管用。我将所有这些都放在一个数组中,我可以看到,对于该条目,我得到了一个空值,但我希望获得文本。我研究了XPath语法,但不能再深入了。有人有什么建议吗?
发布于 2013-04-25 19:49:29
所以我想通了!所以,对于任何看过这篇文章的人来说,这是根据我的HTML文件得到的答案。
要获取您使用的文本....
//div@class = 'entry-content'//a@title//*
这将返回带有标题的div下的所有文本。
https://stackoverflow.com/questions/16204150
复制相似问题