腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
搜索
关闭
文章
问答
(170)
视频
开发者手册
清单
用户
专栏
沙龙
全部问答
原创问答
Stack Exchange问答
更多筛选
回答情况:
全部
有回答
回答已采纳
提问时间:
不限
一周内
一月内
三月内
一年内
问题标签:
未找到与 相关的标签
筛选
重置
1
回答
SparkStreaming
& Kafka: value reduceByKey不是
SparkStreaming
的成员
我试图使用在DStream上执行ETL,但得到了以下错误。你能帮我修一下吗?谢谢。[error] val wordCounts = etl.reduceByKey(_ + _)[error] one error found [error] (compile:compileIncrem
浏览 3
提问于2018-01-14
得票数 2
回答已采纳
2
回答
SparkStreaming
/Kafka偏移处理
我正在尝试整合Spark/Kafka来构建一个流媒体应用程序。Kakfa版本: 0.9火花: 1.6.2你能给我更多关于如何处理补偿的见解吗?JavaInputDStream<String> directKafkaStream = KafkaUtils.createDirectStream(jsc, String.class, String.class, StringDecoder.class, StringDec
浏览 2
修改于2016-09-28
得票数 1
1
回答
使用
Sparkstreaming
从HDFS获取数据
我正在尝试使用spark streaming从HDFS读取数据。下面是我的代码。import org.apache.spark.streaming.{Seconds, StreamingContext}import org.apache.hadoop.io.{LongWritable, Text} val sparkConf = new Sp
浏览 0
提问于2016-10-04
得票数 0
2
回答
SparkStreaming
与Storm的区别
我正在对twitter上的直播流数据做一些分析。我听说了Spark streaming。我想知道哪些最适合直播流数据的分析,因为我的数据从来源来得非常快。
浏览 0
提问于2014-11-22
得票数 2
1
回答
Sparkstreaming
+ Kafka到hdfs
当我尝试使用spark streaming使用来自kafka主题的消息时,得到以下错误错误: `missing or invalid dependency detected while loading class file 'KafkaUtils.class'
浏览 4
修改于2018-07-05
得票数 1
1
回答
Sparkstreaming
_Twitter数据
注意:即使我使用twitter4j-*-3.03 libraies也会出现错误,比如 package com.mobicloud.bhavani.
sparkstreaming
浏览 0
修改于2016-04-30
得票数 2
1
回答
SparkStreaming
:避免checkpointLocation检查
我正在编写一个库,将Apache与自定义环境集成起来。我正在实现自定义流源和流编写器。org.apache.spark.sql.AnalysisException: checkpointLocation must be specified either through option("checkpointLocation", ..
浏览 2
修改于2018-06-29
得票数 8
回答已采纳
1
回答
SparkStreaming
应用程序太慢
在开发
SparkStreaming
应用程序(python)时,我不太清楚它是如何工作的。我只需读取一个json文件流(在目录中弹出)并对每个json对象和一个引用执行连接操作,然后将其写回文本文件。
浏览 1
提问于2017-05-02
得票数 0
回答已采纳
1
回答
SparkStreaming
- ExitCodeException exitCode=13
我正在运行我的火花流应用程序使用火花提交在纱线集群。当我在本地模式下运行它时,它工作正常。但是,当我试图使用火花提交在纱线集群上运行它时,它会运行一段时间,然后以以下方式退出。Container id: container_1435576266959_1208_02_000002Stack trace: ExitCodeException exitCode=13: at org.apache.hadoop.util.Shell.runCommand(She
浏览 6
提问于2015-10-08
得票数 6
回答已采纳
1
回答
SparkStreaming
: DirectStream RDD到dataframe
我正在研究星火流上下文,它正在从avro序列化中的kafka主题中获得数据,如下所示。 "bootstrap.servers" -> "localhost:9092", "key.deserializer" -> "io.confluent.kafka.serializers.KafkaAvroDese
浏览 0
提问于2018-09-17
得票数 0
回答已采纳
1
回答
SparkStreaming
: fileStream()中的错误
我正试图在scala中实现星火流应用程序。我希望使用fileStream()方法来处理新到达的文件以及显示在hadoop目录中的旧文件。 val linesRDD = ssc.fileStream[LongWritable, Text, TextInputFormat](inputDirectory, (t: org.apache.hadoop.fs.Path) => true, false).map(_._2.toString) 但我收到的错误消息如下
浏览 1
修改于2017-05-23
得票数 4
回答已采纳
1
回答
无法通过
SparkStreaming
和宁静写入Druid
我正在尝试将Spark Streaming作业的结果写入到Druid数据源。Spark成功地完成了任务,并将其交给了Druid。Druid开始索引,但没有写入任何内容。import org.apache.spark._import org.apache.spark.streaming._import org.apache.kafka.clients.consumer.ConsumerRecord import or
浏览 3
提问于2017-12-28
得票数 1
回答已采纳
1
回答
我希望使用
sparkstreaming
保持作业运行
有没有可能让流作业一直运行?大约24小时后,它发出此错误并停止处理。我不太确定该怎么处理这件事。 21/01/01 00:03:30 WARN KafkaOffsetReader [stream execution thread for [id =17bf-45aa-a9cd-2f77ec14df61, runId = 43c1-a932-d9f790996a6e]]: Retrying to fetch latest offsets because of incorrect offsets 21/01/01 07:17:04 ERROR RawSocketSender [MdsLogger
浏览 20
提问于2021-04-09
得票数 0
回答已采纳
2
回答
ClassNotFoundException在
SparkStreaming
示例中的应用
我是新的星火流,并试图运行一个例子从教程,我是跟随制作和运行我们自己的NETWORKWORDCOUNT。我完成了第八步,用sbt做了一个罐子。bin/spark-submit --class "NetworkWordCount" --master spark://abc:7077 target/scala-2.11/networkcount_2.11-1.0.jar localhost 9999 java.net.URLClassLoader.findClass(URLC
浏览 3
修改于2017-08-05
得票数 0
回答已采纳
1
回答
SparkStreaming
: SerializedOffset的类转换异常
我正在用Java/Scala编写一个自定义的Spark structured streaming源代码(使用v2接口和Spark 2.3.0)。18/06/20 11:58:49 ERROR MicroBatchExecution: Query [id = 58ec2604-3b04-4912-9ba8-c757d930ac05, runId = 5458caee-6ef7-4864-9968-9cb843075458] terminated with error java.lang.ClassCastExc
浏览 0
修改于2018-06-20
得票数 1
1
回答
SparkStreaming
在出现错误时关闭作业
我有一个流式作业,它每分钟运行一次,在处理完数据后,将其放到hdfs上,并将结果的简化形式放入数据库中。可以从worker内部停止spark作业吗?(sys.exit显然不起作用)
浏览 0
提问于2015-12-10
得票数 3
2
回答
无法执行我的
SparkStreaming
程序
我编写了以下Scala代码,我的平台是CentOS 6.5上的ClouderaCDH5.2.1import org.apache.sparkimport org.apache.spark.SparkContext._import org.apache.spark.streaming.twitter._impo
浏览 1
修改于2014-12-21
得票数 0
1
回答
使用
SparkStreaming
和Kafka从HBase获取数据
我正在尝试将
SparkStreaming
与HBase集成。我正在尝试使用最新的API来连接Cloudera上的HBase和
SparkStreaming
。 这里提到的一些JIRA项目。
浏览 0
修改于2016-06-23
得票数 1
2
回答
KafkaUtils010
SparkStreaming
中的MessageHandler
我想按主题分组,或者在申请时知道消息来自哪个主题: ssc, Subscribe[String, String]( kafkaParameters(BOOTSTRAP_SERVERS,"kafka_test_group_id)) ) 然而,在最新的API中,kafka010似乎不像以前的版本那样支持消息处理程序
浏览 16
修改于2017-03-16
得票数 0
回答已采纳
0
回答
sparkstreaming
产生的日志,越来越大,如何定期删除??
、
sparkstreaming
一直运行,hdfs://***:9000/spark-log 下的log文件很大,spark-default.conf下配置 spark.executor.logs.rolling.time.interval
浏览 286
提问于2018-07-13
第 2 页
第 3 页
第 4 页
第 5 页
第 6 页
第 7 页
第 8 页
第 9 页
点击加载更多
领券