腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
搜索
关闭
文章
问答
(9999+)
视频
开发者手册
清单
用户
专栏
沙龙
全部问答
原创问答
Stack Exchange问答
更多筛选
回答情况:
全部
有回答
回答已采纳
提问时间:
不限
一周内
一月内
三月内
一年内
问题标签:
未找到与 相关的标签
筛选
重置
1
回答
将StructType传递给
架构
的
火花
错误
获取错误:TypeError:'StructType‘对象不是可调用的,同时将StructType传递给模式方法。以下是代码:dataframe = sc.read.text('/path').schema(final_schema)idAO_02
浏览 2
修改于2020-03-13
得票数 3
回答已采纳
1
回答
将
火花
DataFrame的
架构
转换为另一个DataFrame
我在PySpark上有一个星火PySpark,我想将它的模式存储到另一个
火花
DataFrame中。
浏览 3
提问于2019-10-23
得票数 1
回答已采纳
1
回答
阿克卡流与
火花
流
使用akka流与
火花
流进行流处理有什么优缺点?比如,内置背压,性能,容错,内置转换,灵活性等。我不是在问akka vs
火花
正反严格流组件。另外,我并不是在问引擎盖框架
架构
的差异。
浏览 1
提问于2016-07-06
得票数 9
回答已采纳
1
回答
spark数据列的更改模式
我有一个有“学生”栏的
火花
放电数据。" : { "score": {"s" : "165"} }我希望更改该列的
架构
因此,我希望保留空值,但更改null值的
架构
。我在上面的过程中使用了一个udf,这是可行的。change schema data = row.asDic
浏览 1
修改于2020-06-07
得票数 0
回答已采纳
1
回答
在Twitter中使用Nifi + Kafka有什么好处?
我正在寻找
架构
来做情感分析,在流与
火花
,我偶然发现了这个
架构
。
浏览 2
修改于2022-01-09
得票数 0
回答已采纳
1
回答
数据库将表移动到SQL数据库中的特定
架构
下面的吡
火花
代码将将数据复制到Azure SQL数据库中的默认dbo
架构
。我们有一个名为OCC的
架构
。有人能修改代码以允许我们将数据复制到
架构
OCC吗?
浏览 7
提问于2022-11-29
得票数 1
回答已采纳
2
回答
星火流和星火应用程序可以在同一个纱线集群中运行吗?
我正在使用Apache、HDFS和Elastichsearch构建lambda
架构
。在下面的图片中,我想要做的是: 到目前为止,我已经用java为我的星火流和
火花
应用程序编写了源代码。我在
火花
文档中读到,
火花
可以在中间层或纱线杂碎器中运行。如图所示,我已经有了hadoop集群。是否有可能在同一个hadoop集群中运行我的星火流和
火花
应用程序?还是我必须为
火花
流添加一个hadoop集群?亚瑟尔
浏览 2
提问于2017-01-13
得票数 2
回答已采纳
2
回答
纱线上的
火花
:如何防止多个
火花
作业被调度
与
火花
在纱线-我没有办法防止并行的工作被安排。我有我的
架构
设置来做纯粹的批处理。 UserCache的
火花
增长非常快。
浏览 2
修改于2016-04-13
得票数 1
回答已采纳
2
回答
星星之火- CSV -可空错误不抛出异常。
有点困惑,为什么
火花
没有抛出异常,而
架构
是用可空的fase定义的。知不知道我的
火花
版本2.2.2
浏览 9
修改于2020-04-13
得票数 3
回答已采纳
1
回答
使用推断模式与在spark数据中加载CSV文件数据时显式传递模式时的性能开销
我是加载CSV数据在
火花
数据与设置inferSchema选项为true。尽管我的CSV文件的模式总是相同的,而且我知道确切的模式。 手动提供模式而不是推断模式是个好主意吗?显式提供
架构
是否提高了性能?
浏览 1
修改于2019-08-14
得票数 1
回答已采纳
1
回答
Flafka (Http -> Flume->Kafka ->Spark流媒体)
我有一个用于实时流的用例,我们将使用Kafka(0.9)作为消息缓冲区,使用
火花
流(1.6)进行流处理(HDP 2.4)。我们将在Http上收到~80~90K/Sec活动。请您提出一个推荐的
架构
,用于将数据摄取到Kafka主题中,这将被
火花
流所消耗。 我们正在考虑弗拉夫卡建筑。
浏览 7
提问于2016-09-29
得票数 0
回答已采纳
1
回答
如何使用SparkSession动态推断模式
我才刚开始学习
火花
。我知道,如果我们将inferSchema选项设置为true,则模式将自动推断。我正在读一个简单的csv文件。如何在代码中不指定任何自定义
架构
的情况下动态推断
架构
。代码应该能够为任何传入数据集构建
架构
。我尝试使用readStream并将我的格式指定为csv,完全跳过了地狱模式选项,但在任何情况下我似乎都需要提供这个选项。
浏览 2
修改于2019-08-12
得票数 0
1
回答
具有复制的Cassandra节点的星火
我找到了一篇文章,其中作者建议使用next Spark
架构
模式(为每个Cassandra节点提供Spark): 我有N个卡桑德拉节点。所有节点都是彼此的完整副本。在我的例子中,为每个Cassandra节点运行
火花
奴隶是否有意义?
浏览 4
提问于2016-04-11
得票数 0
回答已采纳
1
回答
如何在星火上处理任务结果?
我是新来的
火花
,我目前正在努力了解
火花
的
架构
。据我所知,星火集群管理器将任务分配给工作节点,并将数据的分区发送给它们。在那里,每个工作节点执行转换(如映射等)。在它自己特定的数据分区上。如果有人能启发我的话,那就太好了,无论是
火花
文档还是其他有关体系结构的参考资料都无法做到这一点。
浏览 3
修改于2021-09-10
得票数 0
回答已采纳
1
回答
如何使用jdbc
火花
连接器(点燃)创建具有主键的表
我正试图使用
火花
连接器(pyspark)将
火花
数据存储到点燃缓存中,如下所示: .option("url", "jdbc:ignite:thin:TEXT') \java.sql.SQLException: No PRIMARY KEY defined for CREATE TABLE 程序库org.apache.ignite:点燃-
火花
createTableOptions在
架构
括号和出现sq
浏览 12
提问于2020-10-27
得票数 1
1
回答
我可以在Azure环境之外使用Azure Synapse功能吗?
论坛, 我目前正在研究Azure Synapse作为迁移我们的on数据
架构
的一种选择。我对它提供的功能感到兴奋- SQL池、
火花
池和附带的笔记本。现在我的问题是,Synapse是否适合这样的
架构
?我是否可以调用SQL池或
火花
池从蔚蓝的环境之外(例如从kubernetes吊舱)进行繁重的数据提升?
浏览 3
提问于2022-03-31
得票数 1
回答已采纳
1
回答
写一个
火花
数据或者写一个胶水动态框架,哪个选项在AWS胶中更好?
然后将动态框架转换为激发数据格式以应用
架构
转换。为了将数据写回s3,我看到开发人员将数据转换回动态框架。写
火花
数据帧比写胶水动态框架有什么优势吗?
浏览 1
修改于2020-06-13
得票数 3
回答已采纳
1
回答
电
火花
阅读拼花中缺少的列
我有拼花文件,我需要从
火花
读。有些文件中缺少几个列,这些列在新文件中存在。如果我定义
架构
并执行 sqlContext.read.parquet('s3://....').schema(parquet_schema
浏览 0
修改于2018-09-15
得票数 2
回答已采纳
1
回答
火花
放电/nested元素中的迭代数组
我有input_data作为input_data的
架构
是有什么更好的方法来实现输出的
火花
sql或
火花
df?
浏览 2
提问于2022-04-07
得票数 0
2
回答
B2C网站中卡夫卡/风暴/
火花
的可能用例
我们喜欢进入新的技术领域,我们看到一些热门趋势是卡夫卡/
火花
/风暴。谢谢
浏览 5
提问于2017-01-11
得票数 0
第 2 页
第 3 页
第 4 页
第 5 页
第 6 页
第 7 页
第 8 页
第 9 页
第 10 页
第 11 页
点击加载更多
领券