问电子病历和S3源上的spark流
EN

Stack Overflow用户

提问于 2017-04-27 15:07:06

回答 1查看 594关注 0票数 0

我正在尝试使用s3作为源，在电子病历中使用齐柏林飞艇笔记本打印一个流。

%pyspark
from pyspark.streaming import StreamingContext
from pyspark.sql import Row, SparkSession
ssc = StreamingContext(sc, 45)
streams=ssc.textFileStream('s3://realtime-nyc-bike/')
streams.pprint()

但是，什么都没有打印出来。Bucket名称正确。问题可能是什么？

amazon-s3

pyspark

emr

回答 1

Stack Overflow用户

发布于 2017-06-15 03:02:15

来自Spark streaming文档：

Spark Streaming仅设置它将在启动时执行的计算，并且还没有真正的处理开始。要在设置完所有转换后开始处理，最后调用

ssc.start()             // Start the computation
ssc.awaitTermination()  // Wait for the computation to terminate

票数 1

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/43650868

复制

相似问题

问电子病历和S3源上的spark流
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问电子病历和S3源上的spark流EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问电子病历和S3源上的spark流
EN