首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >过滤IMPORTHTML数据

过滤IMPORTHTML数据
EN

Stack Overflow用户
提问于 2020-07-31 15:43:17
回答 2查看 936关注 0票数 1

当我导入数据时,它以这种格式出现(图1),带有空格。我想知道是否有任何方法来调整这些空白消失,这两个模型(图2和图3)是否有任何方法来达到它们对我来说很重要。

记住所有的日期都有/,而所有的时间都有:

我试着从QUERY中过滤,但是当我试图将日期消失而只保留时间时,我尝试通过REGEXMATCH使用/:将日期和时间分离开来,但也没有成功。

我也通过IMPORTXML尝试过,但是一些数据最终无法在站点的某些页面上正确导入,因为IMPORTHTML不会发生这些错误。我使用的XML's是:

"//tr[@class='no-date-repetition-new' and ..//td[@class='team team-a']] | //tr[@class='no-date-repetition-new live-now' and ..//td[@class='team team-a']]"

"//td[@class='team team-a']/a | //td[@class='team team-a strong']/a"

当前的公式如下:

=IMPORTHTML("https://int.soccerway.com/national/austria/1-liga/20192020/regular-season/r54328/","table",1)

IMPORTHTML原文:

预期格式:

EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2020-07-31 20:05:59

所需的不是过滤,而是重构导入的数据。

无论如何,我认为获得最终结果的更容易的解决方案是使用多个IMPORTXML公式。

URL

A1:https://int.soccerway.com/national/austria/1-liga/20192020/regular-season/r54328/

标头

A2://table[contains(@class,'matches')]/thead/tr/th

A3://td[contains(@class,'date')]/parent::tr

球队和得分

A4://td[contains(@class,'team-a')]/parent::tr

A6:=transpose(IMPORTXML($A$1,A2))

A7:=IMPORTXML($A$1,A3)

B7:=IMPORTXML(A1,A4)

您可能希望用静态值替换A6上的公式,以便正确地放置它们。

票数 1
EN

Stack Overflow用户

发布于 2020-07-31 20:50:17

您可以在一个公式中将两个查询(一个相邻)连接在一起,以获得结果。

代码语言:javascript
复制
={QUERY(IMPORTHTML("https://int.soccerway.com/national/austria/1-liga/20192020/regular-season/r54328/","table",1), 
    "select Col1 where Col2 is null and not Col1 contains '*'",1), 
QUERY(IMPORTHTML("https://int.soccerway.com/national/austria/1-liga/20192020/regular-season/r54328/","table",1), 
    "select Col1, Col2, Col3, Col4 where Col2 is not null label Col1 'Time'",1)}

公式的工作原理:

正如您注意到的那样,

  1. 在这两个查询中的数据部分是相同的。实际上不同的是“我们从查询中要求什么”,在第一个使用"select Col1 where Col2 is null and not Col1 contains '*'"
  2. In的
  3. ,第二个"select Col1, Col2, Col3, Col4 where Col2 is not null label Col1 'Time'"
  4. We通过将它们连接在一起创建一个数组,就像在={1stQUERY,2ndQUERY}

中一样。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/63195003

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档