首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >PARQUET_READ_PARALLELISM是什么?

PARQUET_READ_PARALLELISM是什么?
EN

Stack Overflow用户
提问于 2015-11-15 23:30:44
回答 1查看 1.2K关注 0票数 2

当我执行我的工作时,我看到:parquet.hadoop.ParquetFileReader: Initiating action with parallelism: 5

默认设置为5,但它是什么?我怎么才能用它来获得更好的性能呢?

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2016-03-17 20:20:45

是的,默认为5。

配置参数的名称是parquet.metadata.read.parallelism。它只影响读取Parquet文件的线程数量。

我认为它对性能的影响不大,因为它只与元数据的读取有关,而不是数据本身。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/33726400

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档