在hadoop中,我们不使用java序列化,因为它体积大,速度慢。因此hadoop提供了与java序列化相比快速的Writable。
在spark中,默认情况下我们使用java序列化,如果我们不想使用java序列化,则可以使用Kryo序列化。我的问题是,为什么不能(不)在spark中使用hadoop序列化呢?,因为我们知道它是紧凑和快速的。
发布于 2020-02-27 13:51:48
您可以通过newAPIHadoop读取器/ SparkContext的编写方法使用输入和输出格式(由Writable输入)
https://stackoverflow.com/questions/60426859
复制相似问题