文章/答案/技术大牛

发布

问Google和XPath中的IMPORTDATA
EN

Stack Overflow用户

提问于 2022-08-26 10:24:23

回答 1查看 66关注 0票数 1

在GoogleSheet上，我需要在这个页面上爬行亚马逊的股价(跟随xPath)：https://www.boursorama.com/cours/AMZN/

//*[@id="main-content"]/div/section[1]/header/div/div/div[1]/div[1]/div/div[1]/span[1]

--我可以用这个公式做，它可以工作：

IMPORTXML("https://www.boursorama.com/cours/AMZN/", "//*[@id=""main-content""]/div/section[1]/header/div/div/div[1]/div[1]/div/div[1]/span[1]")

但是，IMPORTXML函数有一个日常的局限性。

因此，为了避免谷歌的日常限制，我需要使用，所以应该是这样的：

=REGEXEXTRACT(QUERY(TRANSPOSE(IMPORTDATA(
 "https://www.boursorama.com/cours/AMZN/"));
 "where Col1 contains 'basp:""'");"(\d+.*)""") <-- here is the line where something is wrong

我不习惯和REGEX一起工作，有人能帮我吗？

google-sheets

web-scraping

import

google-sheets-formula

regex

回答 1

Stack Overflow用户

回答已采纳

发布于 2022-08-26 21:34:02

尝试：

=REGEXREPLACE(QUERY(FLATTEN(IMPORTDATA(
 "https://www.boursorama.com/cours/AMZN")),
 "where Col1 contains 'data-ist-bid-price>'", 0), 
 "</?\S+[^<>]*>", )*1

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/73499541

复制

相似问题

问Google和XPath中的IMPORTDATA
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问Google和XPath中的IMPORTDATAEN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问Google和XPath中的IMPORTDATA
EN