首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >优化命令对结构化流式作业正在写入的Delta lake表没有帮助

优化命令对结构化流式作业正在写入的Delta lake表没有帮助
EN

Stack Overflow用户
提问于 2020-02-20 21:05:35
回答 1查看 150关注 0票数 1

我有一个结构化的流式作业,它从事件中心读取,并将增量湖表作为/mytablepath写入,该表存储在Azure blob存储中。在过去两个月的生产运行中,它已经在存储中创建了大约1000个小文件,每个文件只有2-3行。

我尝试在增量湖表(Path)上运行优化命令,但即使在blob存储上文件数量没有减少,且当我在notebook中的表上运行任何查询时,它仍然显示警告“查询在包含许多小文件的增量表上,运行优化以提高性能”。

谢谢

EN

回答 1

Stack Overflow用户

发布于 2020-02-21 10:53:20

在运行optimize之后,您需要运行vacuum来清理小文件。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/60320625

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档