我们是否有针对Snowflake的详细白皮书,其中包括对架构选择的深入解释?类似于Google BigQuery的Dremel白皮书。
Synapse、Snowflake、BigQuery和RedShift在架构上非常相似。我试图对它们在架构和功能上的细微差别做一个详细的分析。
发布于 2020-12-08 16:03:00
SIGMOD 2016,“雪花弹性数据仓库”:
我们决定进行一次根本性的重新设计。我们的任务是为云构建一个企业就绪的数据仓库解决方案。结果产生了Snowflake Elastic Data Warehouse,简称“Snowflake”。Snowflake是一个多租户、事务、安全、高度可扩展和弹性的系统,具有完整的SQL支持和针对半结构化和无模式数据的内置扩展。该系统在亚马逊云中以即付即用服务的形式提供。用户将他们的数据上传到云中,并可以使用熟悉的工具和界面立即管理和查询数据。Snowflake于2012年底开始实施,自2015年6月以来一直普遍可用。如今,越来越多的大大小小的组织都在生产中使用Snowflake。该系统每天对数of的数据运行数百万次查询。在本文中,我们描述了Snowflake的设计及其新颖的多集群、共享数据架构。本文重点介绍了Snowflake的一些关键特性:极高的弹性和可用性、半结构化和无模式数据、时间旅行和端到端安全性。它总结了吸取的教训和对正在进行的工作的展望。
https://stackoverflow.com/questions/65194974
复制相似问题