我们在亚马逊网络服务S3上创建了一个数据采集,目前我们只使用了一个存储桶,我们的数据湖由一些区域划分:S3://存储桶/着陆/主题/表S3://存储桶/原始/主题/表S3://存储桶/精炼/主题/表S3://存储桶/暂存/主题/表
因此,我正在阅读有关s3性能最佳实践的文章,一些人建议将数据记录划分到不同的存储桶中,对于特定情况,将一个存储桶用于大表。我们的数据量现在很小,但我们的公司正在增长fast...so有哪些最佳实践可以在未来不出现性能问题?
https://docs.aws.amazon.com/AmazonS3/latest/dev/optimizing-performance.html
我正在读关于限制的文章,但是前缀是什么?
S3://存储桶/登陆/主题/表1 s3://存储桶/登陆/主题/表2
两个前缀?还是只有一个?
谢谢。
发布于 2020-11-30 02:39:37
根据https://docs.aws.amazon.com/AmazonS3/latest/user-guide/using-folders.html的说法
但是,为了组织简单起见,
S3控制台支持文件夹概念作为对对象进行分组的一种方式。亚马逊S3通过对对象使用共享名称前缀来实现这一点(即,对象的名称以公共字符串开头)。对象名称也称为键名称。
因此,前缀将是键名中最后一个斜杠之前的所有内容。
https://stackoverflow.com/questions/65063564
复制相似问题