首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >以Parquet格式将GCS导出到GCS

以Parquet格式将GCS导出到GCS
EN

Stack Overflow用户
提问于 2021-03-04 05:54:37
回答 1查看 1.2K关注 0票数 1

我有GCP中的数据,我想以Parquet格式将这些数据导出到GCS中,我发现这是不可能的,只有我可以用SQL和CSV格式来导出数据。

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2021-03-04 08:39:01

我建议你通过BigQuery来实现这一点。

  1. 连接带有联邦查询的BigQuery到实例特征
  2. 使用数据在BigQuery中创建一个新表
代码语言:javascript
复制
CREATE TABLE my_dataset.temp_table AS
SELECT * FROM EXTERNAL_QUERY("project_id.region.connection_name", "SELECT * FROM .....;");
  1. 使用BigQuery导出表特性与地板选项(这是在预览阶段)
代码语言:javascript
复制
bq --location=region extract \
--destination_format parquet \
project_id:my_dataset.temp_table \
gs://bucket/filename.parquet
  1. 删除BigQuery中的临时表

这样可以保证您只使用一个文件(或少量的切分文件)。

但是,您可以加快进程,但此解决方案可以生成更多的文件。

  1. 用联邦表特性将BigQuery连接到实例
  2. 仅在一个查询中使用将数据导出到GCS
代码语言:javascript
复制
EXPORT DATA OPTIONS(
  uri='gs://bucket/filename.parquet*',
  format='PARQUET') AS
SELECT * FROM EXTERNAL_QUERY("project_id.region.connection_name", "SELECT * FROM .....;");

语句

票数 4
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/66469369

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档