我正在做一些web爬行,但是我在选择要通过xpath语句提取的正确数据时遇到了一些问题。我希望这里有人能给我正确的解决方案,这样我就可以完成这项工作。以下是该站点的html:
<h5><a href="some-website-url" target="_blank"> Some sample text</a> (2015)</h5>我想要找到一种方法,通过给它一个xpath语句来将文本"(2015)“从站点中提取出来,但我无法弄清楚。我试过了
//HTML/BODY[1]/DIV[1]/H5[1]/text()但不是成功。
//HTML/BODY[1]/DIV[1]/H5[1]是程序在提取文本时给我的xpath地址
Some sample text (2015)离开网站。和代码
//HTML/BODY[1]/DIV[1]/H5[1]/text()给出了同样的结果。
请帮我一点忙。
非常感谢。
PS:我正在开发的用于提取站点的程序是Octophass6.2版本
发布于 2017-11-02 23:08:51
找到一种方法来提取文本"
(2015)“
xpath表达式:
//div[1]/h5/a/following-sibling::text()https://stackoverflow.com/questions/47078442
复制相似问题