首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何生成与tpc基准测试并行的表?

如何生成与tpc基准测试并行的表?
EN

Stack Overflow用户
提问于 2019-06-17 12:58:54
回答 1查看 502关注 0票数 0

如何运行tpc数据生成(dsdgen),然后以并行分布式模式对这些数据(dsqgen)运行查询。我正在使用火花上的纱线配置(spark.master yarn)和存储数据的突发缓冲存储系统。

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2019-07-24 12:35:01

请查看我目前的探索@ https://github.com/dhiraa/spark-tpcds。T下有应用程序,可用于并行生成数据。

或者您可以查看我的reference @ https://github.com/maropu/spark-tpcds-datagen

在这两种情况下,不要忘记使用选项“-分区表”来使用并行生成。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/56631851

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档