首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >Google sheets错误: url内容处的资源超出了importhtml的最大大小

Google sheets错误: url内容处的资源超出了importhtml的最大大小
EN

Stack Overflow用户
提问于 2021-08-28 20:01:31
回答 1查看 1.1K关注 0票数 0

我试图获得一些数据从这个页面https://agones.gr与importhtml的记录目的,但当一天有很多比赛,这是不可能的数据(通常它发生在星期六,那里有很多比赛。有没有其他方法可以做到这一点。任何帮助都将不胜感激。

EN

回答 1

Stack Overflow用户

发布于 2021-08-29 01:24:55

当数组太大时,不能使用importltml。相反,您可以通过脚本来完成此操作:

代码语言:javascript
复制
function importTableHTML(url) {
  var html = '<table' + UrlFetchApp.fetch(url).getContentText().replace(/(\r\n|\n|\r)/gm,"").match(/(?<=\<table).*(?=\<\/table)/g) + '</table>';
  var trs = [...html.matchAll(/<tr[\s\S\w]+?<\/tr>/g)];
  var data = [];
  for (var i=0;i<trs.length;i++){
    var tds = [...trs[i][0].matchAll(/<(td|th)[\s\S\w]+?<\/(td|th)>/g)];
    var prov = [];
    for (var j=0;j<tds.length;j++){
      donnee=tds[j][0].match(/(?<=\>).*(?=\<\/)/g)[0].replace(/&nbsp;/g,' ');
      prov.push(stripTags(donnee));
    }
    data.push(prov);
  }
  return(data);
}

function stripTags(body) {
  var regex = /(<([^>]+)>)/ig;
  return body.replace(regex,"");
}

https://docs.google.com/spreadsheets/d/16VY07Zb4y5-yOzIJvCdKRxsX7pdCocFq8RGCgDsrmdc/copy

票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/68967749

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档