首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >火花RDD循环容错

火花RDD循环容错
EN

Stack Overflow用户
提问于 2022-11-17 13:40:47
回答 1查看 18关注 0票数 0

RDD通过谱系图提供容错功能,这就是星火成为容错的方式

那么,在使用spark数据帧时,spark是否会在后台创建RDDs以实现容错呢?

一般来说,如果我在星火集群上执行任何活动/转换,那么spark是否使用RDD?

EN

回答 1

Stack Overflow用户

发布于 2022-11-17 13:51:05

RDDs是星火的脊梁和基本的数据结构.Dataframes和数据集是构建在RDD之上的,旨在为简单性提供一个抽象。

将RDDs看作类似Scala集合,但分布在自然中。

然而,Dataframes作为一个具有模式的RDD (实际上,Dataframes是从SchemaRDD演化而来),即一个在本质上分布的二维集合。在引擎盖下,星火可以创建RDD。

如果您有兴趣了解更多关于它的知识,请考虑阅读这些- https://www.databricks.com/blog/2016/07/14/a-tale-of-three-apache-spark-apis-rdds-dataframes-and-datasets.html

Difference between DataFrame, Dataset, and RDD in Spark

此外,您还可以在Spark (任务DAG)中看到底层的RDDs。

[

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/74476476

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档