首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何将数据从S3移动到雪花

如何将数据从S3移动到雪花
EN

Stack Overflow用户
提问于 2021-12-23 20:03:36
回答 3查看 192关注 0票数 0

关于将表从S3复制到雪花的过程,我有几个问题。

该计划是将AWS/S3中的一些数据复制到雪花上,然后用DataRobot进行建模。

  1. 我们有一些包含PII数据的表,我们想对Datarobot隐藏这些列,您对这个问题有什么建议?

  1. AWS中的模式在复制过程中需要匹配雪花中的模式。

谢谢,

马里

EN

回答 3

Stack Overflow用户

发布于 2021-12-23 21:51:39

假设您知道正在加载的数据的架构,那么您有几个使用雪花的选项:

  1. 使用COPY INTO语句将数据加载到表中,
  2. 使用SNOWPIPE将数据自动加载到表中(对于定期将新数据加载到雪花表中的情况),
  3. 使用EXTERNAL TABLES将S3数据直接引用为雪花表中的表。您可能希望为此使用MATERIALIZED VIEWS,以便使表执行得更好。

至于从DataRobot中雇用PII数据,我建议利用雪花DYNAMIC DATA MASKING来建立规则,混淆DataRobot正在使用的角色的数据(或取消它)。

所有这些特性都在雪花文档中得到了很好的记录:https://docs.snowflake.com/

票数 0
EN

Stack Overflow用户

发布于 2021-12-25 09:15:10

关于隐藏PII元素,您可以使用两个不同的角色,一个是data_owner(创建表并在其中加载数据的角色),另一个是data_modelling (用于使用数据机器人)。

使用数据所有者创建掩蔽策略,以便数据机器人看不到列数据。

关于复制数据的问题,没有要求AWS S3文件夹必须与雪花同步。您可以使用任何名称创建外部阶段,并将其指向任何S3文件夹。

票数 0
EN

Stack Overflow用户

发布于 2021-12-25 20:54:46

雪花文档有一个很好的例子,它可以帮助您掌握以下内容:

代码语言:javascript
复制
https://docs.snowflake.com/en/user-guide/data-load-s3.html
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/70466904

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档