我正在读一本书Hadoop应用程序架构(Hadoop应用程序架构),这本书很古老,但非常有趣。在阅读时,我注意到Avro被认为是数据序列化框架,而Parquet则被认为是列数据格式。
提前感谢您的帮助
发布于 2020-02-06 02:48:20
序列化是将数据转换为格式的过程。
Avro文件以Avro格式存储,这是面向行的,是的。
使Avro成为一个框架的原因是它有一个协议(RPC)和一种格式。
https://stackoverflow.com/questions/60079836
复制相似问题