我已经创建了2个数据proc,cluster.The要求是使用1个单元元存储,并且两个集群都可以访问。第一个是ETL集群,它有-作用域=sql,第二个是针对ML用户的--作用域=云平台.The数据库,使用ETL集群创建的表不被ML集群访问。如果我必须在每个集群中添加-作用域=sql,任何人都能提供帮助吗?
ETL集群创建命令:
gcloud dataproc clusters create amlgcbuatbi-report \
> --project=${PROJECT} \
> --master-machine-type n1-standard-1 --worker-machine-type n1-standard-1 --master-boot-disk-size 50 --worker-boot-disk-size 50 \
> --zone=${ZONE} \
> --num-workers=${WORKERS} \
> --scopes=sql-admin \
> --image-version=1.3 \
> --initialization-actions=gs://dataproc-initialization-actions/cloud-sql-proxy/cloud-sql-proxy.sh \
> --properties=hive:hive.metastore.warehouse.dir=gs://gftat/data \
> --metadata="hive-metastore-instance=$PROJECT:$REGION:metaore-dev001"输出:
0: jdbc:hive2://localhost:10000/default> show databases;
+------------------+
| database_name |
+------------------+
| default |
| gcb_dw |
| l1_gcb_trxn_raw |
+------------------+ML群集创建命令:
gcloud dataproc clusters create amlgcbuatbi-ml \
> --project=${PROJECT} \
> --master-machine-type n1-standard-1 --worker-machine-type n1-standard-1 --master-boot-disk-size 50 --worker-boot-disk-size 50 \
> --zone=${ZONE} \
> --num-workers=${WORKERS} \
> --scopes=cloud-platform \
> --image-version=1.3 \
> --optional-components=PRESTO \
> --initialization-actions=gs://dataproc-initialization-actions/cloud-sql-proxy/cloud-sql-proxy.sh \
> --initialization-actions=gs://dataproc-initialization-actions/presto/presto.sh \
> --metadata="hive-metastore-instance=$PROJECT:$REGION:metaore-dev001"输出:这里的无法看到DB和表。
0: jdbc:hive2://localhost:10000/default> show databases;
+----------------+
| database_name |
+----------------+
| default |
+----------------+发布于 2019-11-17 09:18:04
--initialization-actions标志需要一个逗号分隔的列表,而不是重复该标志来将多个初始化操作附加到列表中。试一试
--initialization-actions=gs://dataproc-initialization-actions/cloud-sql-proxy/cloud-sql-proxy.sh,gs://dataproc-initialization-actions/presto/presto.sh而不是两个单独的--initialization-actions标志。
https://stackoverflow.com/questions/58896768
复制相似问题