首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >能给我一些关于Azure数据湖内部设备的书吗?

能给我一些关于Azure数据湖内部设备的书吗?
EN

Stack Overflow用户
提问于 2017-02-22 10:57:22
回答 2查看 670关注 0票数 4

我不想使用ADL和ADLA作为黑匣子。我需要了解齿轮如何转动底座,以有效的方式使用它。

在这里我可以找到描述内部情况的信息:

  1. 如何处理U查询
  2. 并行是如何工作的
  3. 如何在低层ADL中组织存储
  4. 数据库的存储是如何在低级别的ADL中组织的(它是行存储还是列存储)
  5. 分区是如何组织的

有大量的书籍和白纸描述RDBMS引擎的内部。它是否存在于ADL/ADLA?

有很多人在Azure工作。您是否可以发布任何草稿/白纸,以便按原样使用(非公开的)。

EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2017-02-24 11:33:19

其中一些信息可以在我们所做的介绍中获得。例如,您可以在我的slideshare帐户:http://www.slideshare.net/MichaelRys上找到其中一些演示文稿。

为了回答你上面的一些问题:

当前U表的聚集索引版本存储在目录文件夹中,结构化为所谓的结构化流文件。这些是高度可压缩的、可扩展的文件,它们使用面向行的结构,具有独立的元数据和统计数据(可以创建更详细的统计数据)。该表结构提供了2级分区:可寻址分区和内部分配方案(哈希、范围等)。两者都有助于并行化,尽管分发方案更有利于性能,而分区更多地用于数据生命周期管理。它们是没有限制的,尽管每个分发桶的甜蜜点是1GB到4GB。

1 AU基本上是一个容器。ADLS在体系结构上不是HDFS,而是为兼容性提供了WebHDFS API。

票数 7
EN

Stack Overflow用户

发布于 2017-02-23 19:42:24

这是一个相当宽泛的问题。我想您已经从ADLA和U?https://learn.microsoft.com/en-us/azure/data-lake-analytics/ https://msdn.microsoft.com/library/azure/mt591959的现有文档开始了。

2016年11月,阿德拉·GA( ADLA GA)与1987年的Server ( SQL Server)进行了比较--这是一个非常明显的苹果和橙子比较。

也许我们可以从你的具体问题开始?

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/42389282

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档