我有GCP中的数据,我想以Parquet格式将这些数据导出到GCS中,我发现这是不可能的,只有我可以用SQL和CSV格式来导出数据。
发布于 2021-03-04 08:39:01
我建议你通过BigQuery来实现这一点。
CREATE TABLE my_dataset.temp_table AS
SELECT * FROM EXTERNAL_QUERY("project_id.region.connection_name", "SELECT * FROM .....;");bq --location=region extract \
--destination_format parquet \
project_id:my_dataset.temp_table \
gs://bucket/filename.parquet这样可以保证您只使用一个文件(或少量的切分文件)。
但是,您可以加快进程,但此解决方案可以生成更多的文件。
EXPORT DATA OPTIONS(
uri='gs://bucket/filename.parquet*',
format='PARQUET') AS
SELECT * FROM EXTERNAL_QUERY("project_id.region.connection_name", "SELECT * FROM .....;");https://stackoverflow.com/questions/66469369
复制相似问题