首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >Airflow - time_partitioning operator

Airflow - time_partitioning operator
EN

Stack Overflow用户
提问于 2020-08-09 23:21:22
回答 2查看 914关注 0票数 0

我使用的是GoogleCloudStorageToBigQueryOperator。我想将CSV文件中的数据从GCS加载到BQ,并将时间分区设置为‘hour’。我已经使用了参数:

代码语言:javascript
复制
 time_partitioning = [‘hr’]

但是,数据是在Day level分区上加载的。谁能指出‘time_partitioning’需要的参数?我希望被摄取的分区处于小时级别。

EN

回答 2

Stack Overflow用户

发布于 2020-08-09 23:49:30

timePartitioning实际上是一个字典对象,而不是一个列表。

代码语言:javascript
复制
:param time_partitioning: configure optional time partitioning fields i.e.
    partition by field, type and  expiration as per API specifications.
    .. seealso::
        https://cloud.google.com/bigquery/docs/reference/rest/v2/tables#timePartitioning
:type time_partitioning: dict

您可以参考上面的云链接来设置time_partitioning字段和类型(小时/天)。

GoogleCloudStorageToBigQueryOperator类已弃用,因此您可以开始使用GCSToBigQueryOperator运算符。

票数 1
EN

Stack Overflow用户

发布于 2020-08-11 00:39:37

使用GCSToBigQueryOperator并传递参数,如下所示,已解决此问题:

time_partitioning ={‘类型’:‘小时’}

有关GoogleCloudStorageToBigQueryOperator被废弃并被GCSToBigQueryOperator取代的详细信息,可以在here中找到

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/63328055

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档