首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何解决Azure Databricks Autoloader cloudfiles源文件中偏移不匹配的错误?

如何解决Azure Databricks Autoloader cloudfiles源文件中偏移不匹配的错误?
EN

Stack Overflow用户
提问于 2021-10-01 06:40:38
回答 1查看 189关注 0票数 2

当从Autoloader流读取的数据源中删除某些文件时,就会发生这种情况。

代码语言:javascript
复制
try:
    raw_df = spark.readStream.format("cloudFiles") \
            .option("cloudFiles.format","csv") \
            .option("cloudFiles.includeExistingFiles", "true") \
            .option("cloudFiles.allowOverwrites", "true") \
            .option("cloudFiles.schemaLocation", 
                opPath.outputPath +"/checkpoints/" + storageAccountInfo.adlsContainerName) \
            .option("delimiter","\t")\
            .load(source)

  except Exception as f:
    print(f)

误差图像

EN

回答 1

Stack Overflow用户

发布于 2022-03-09 08:27:33

我意识到这是因为一些文件被删除了blob存储,而blob存储是cloudfiles流的来源。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/69401548

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档