我的Azure Databrick的很大一部分费用都花在了存储帐户上。
作为"Azure databricks -成本优化“步骤的一部分,考虑将数据(即增量表、视图、函数等)存储在挂载对象存储(如Blob存储)中,而不是在DBFS根中存储数据。这样我就可以使用Blob存储的冷/存档层来降低成本。
这种Blob存储方法(而不是在DBFS根目录中)是否有效?
这真的能节省一些用于Azure数据库存储的成本吗?
如果这样做,会有任何性能问题吗?
发布于 2022-10-27 13:53:07
DBFS通常用于存储生产数据,原因有多种,例如,没有外部访问,也没有对数据生命周期的控制等,因此您应该为该数据使用一个单独的存储帐户。
但真的,你的大部分费用都是从仓库里来的吗?通常,它比计算成本小得多,等等。
Databricks现场团队最近发布了一个关于成本管理和优化的非常好的博客帖子。
https://stackoverflow.com/questions/74209952
复制相似问题