我希望在我们已经做过的事情上得到别人的看法,并开始意识到这不是最好的主意。
以下是关于我们的“环境”的一些信息:
几个月前,我们在S3中启用了智能Tiering,其中对象分别在90天和180天内被移动到Archive和respectively。我们现在看到了这一决定的失败。OUr业务合作伙伴无法查询3个月前在雅典娜(帐户B)的数据(帐户A)。哇哦。
我想我们不理解智能分层的目的,并希望雅典娜能够在查询数据时将分层对象移回标准的s3 (如在即时检索中)。
在审查智能分层过程中,肯定有一些用例我们忽略了。
我很好奇其他人是如何利用智能分层的?您是否只将业务伙伴不需要的分层对象作为“即时检索”?
发布于 2022-09-14 22:08:47
如果您的目标是降低存储成本,那么研究和理解Amazon提供的各种存储类是值得的。
它们一般可分为三类:
见表on:比较Amazon的S3存储类
对于用例,可以考虑在默认情况下将数据保存在中(因为数据被大量访问),然后将90天以上的数据移动到S3 One Zone --罕见的Access。它仍然是可访问的,但如果很少使用,它的存储成本将更低。
我还建议将您的数据转换为Snappy压缩的Parquet格式(最好是分区的),这将减少所需的存储量,并允许雅典娜选择性地选择它需要访问的对象。它还将使雅典娜跑得更快,并降低雅典娜查询的成本。
https://stackoverflow.com/questions/73723067
复制相似问题