在Google Sheets中使用=IMPORTXML(),我想使用XPath从<ul>的<li>中的<a>中提取@href属性,前提是<li> string-length()超过20个字符。
示例:
<html>
<head>...</head>
<body>
...
<ul>
<li>123456<a href="google.com">78</a>90123456789</li>
<!-- 19 chars !-->
<li>123456789<a href="bing.com">0123</a>45</li>
<!-- 15 chars !-->
<li>12345<a href="yahoo.com">6789012</a>345678901234567890</li> <!-- 30 chars !-->
</ul>
...
</body>
</html>在这里,我希望只接收yahoo.com,因为包含的<li>是列表中唯一超过20个字符的one。
我没有找到适合我的XPath语法。有什么建议吗?
发布于 2021-05-27 17:27:04
返回所有li元素的href属性,所有li元素都是ul元素的直接子元素,且li节点字符串长度大于20:
//ul/li[string-length(.)>20]/a/@href它为您的示例选择:
href="yahoo.com"如果您只需要该字符串:
//ul/li[string-length(.)>20]/a/@href/string()它会选择:
yahoo.comhttps://stackoverflow.com/questions/67719062
复制相似问题