开发者社区

文档建议反馈控制台

文章/答案/技术大牛

发布

社区首页 >问答首页 >如何生成与tpc基准测试并行的表？

问如何生成与tpc基准测试并行的表？
EN

Stack Overflow用户

提问于 2019-06-17 12:58:54

回答 1查看 502关注 0票数 0

如何运行tpc数据生成(dsdgen)，然后以并行分布式模式对这些数据(dsqgen)运行查询。我正在使用火花上的纱线配置(spark.master yarn)和存储数据的突发缓冲存储系统。

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2019-07-24 12:35:01

请查看我目前的探索@ https://github.com/dhiraa/spark-tpcds。T下有应用程序，可用于并行生成数据。

或者您可以查看我的reference @ https://github.com/maropu/spark-tpcds-datagen

在这两种情况下，不要忘记使用选项“-分区表”来使用并行生成。

票数 0

EN

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/56631851

复制

相似问题