RDD通过谱系图提供容错功能,这就是星火成为容错的方式
那么,在使用spark数据帧时,spark是否会在后台创建RDDs以实现容错呢?
一般来说,如果我在星火集群上执行任何活动/转换,那么spark是否使用RDD?
发布于 2022-11-17 13:51:05
RDDs是星火的脊梁和基本的数据结构.Dataframes和数据集是构建在RDD之上的,旨在为简单性提供一个抽象。
将RDDs看作类似Scala集合,但分布在自然中。
然而,Dataframes作为一个具有模式的RDD (实际上,Dataframes是从SchemaRDD演化而来),即一个在本质上分布的二维集合。在引擎盖下,星火可以创建RDD。
如果您有兴趣了解更多关于它的知识,请考虑阅读这些- https://www.databricks.com/blog/2016/07/14/a-tale-of-three-apache-spark-apis-rdds-dataframes-and-datasets.html
Difference between DataFrame, Dataset, and RDD in Spark
此外,您还可以在Spark (任务DAG)中看到底层的RDDs。
[

https://stackoverflow.com/questions/74476476
复制相似问题