我正在尝试将几千家公司上季度的研发费用从他们的财务报表中导入到google sheets中。虽然我想从财务报表中导入几个不同的元素,但上个季度的研发费用目前是相关的(可能是前3个季度)。
我已经尝试了几个不同的网站(雅虎金融,彭博社等),但最简单的网址似乎来自stockrow.com,因为我可以简单地自动替换网址中的股票代码。
为了获得xpath,我检查了元素并使用浏览器复制了xpath (已经在Chrome和Firefox上尝试过)。
我在googlesheets上使用了IMPORTXML,并在最后一次尝试中使用了以下输入:=IMPORTXML("https://stockrow.com/JNJ/financials/income/quarterly","/html/body/div[1]/div/div/section/div/div[2]/div[1]/section[4]/div/div[3]/div/div/div[3]/div/div/div[11]/div/span")
我尝试了各种与元素相关的站点、浏览器和xpath的组合,但是无论我做什么,我总是得到相同的错误“导入的内容为空”。
我读了xpath google sheet importxml,但不明白xpath的变化中发生了什么,也不知道如何解决这个特殊的挑战。
因为我希望这在google sheets中的多个股票行情中是可重复的,所以我希望研发费用(以及财务报表中的其他元素)的“位置”在所有页面上都是一致的,而不仅仅是这个挑战的特定解决方案。
期待得到指导。谢谢!!
发布于 2019-12-14 03:13:51
你需要一些其他的资源。Google Sheets不支持抓取JavaScript元素。您可以简单地通过禁用给定站点的JS来测试JS依赖,剩下的就可以抓取了。在你的例子中什么都不是:

https://stackoverflow.com/questions/59328494
复制相似问题