文章/答案/技术大牛

发布

社区首页 >问答首页 >为什么我们不在spark中使用hadoop可写数据类型呢？

问为什么我们不在spark中使用hadoop可写数据类型呢？
EN

Stack Overflow用户

提问于 2020-02-27 05:37:05

回答 1查看 108关注 0票数 1

在hadoop中，我们不使用java序列化，因为它体积大，速度慢。因此hadoop提供了与java序列化相比快速的Writable。

在spark中，默认情况下我们使用java序列化，如果我们不想使用java序列化，则可以使用Kryo序列化。我的问题是，为什么不能(不)在spark中使用hadoop序列化呢？，因为我们知道它是紧凑和快速的。

发布于 2020-02-27 13:51:48

您可以通过newAPIHadoop读取器/ SparkContext的编写方法使用输入和输出格式(由Writable输入)

票数 1

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/60426859

复制

相似问题

问为什么我们不在spark中使用hadoop可写数据类型呢？EN