我一直在阅读关于机器学习模型、部署和管道的文章,到目前为止,大多数源都建议数据应该从某种基于云的存储或源中摄取,无论是AWS S3、Kaggle、Bigquery还是其他任何东西。
现在问题是,在我的公司,我们分析敏感的客户端数据,我认为这些数据不应该存储在云中,因为它可能对安全构成威胁,或者至少它不应该因为GDPR而离开这个国家/欧盟。
那么,考虑到机器学习流水线如何使用脱机本地数据来工作呢?
发布于 2019-12-04 14:37:31
四种选择:
发布于 2019-12-04 11:35:20
没有“云”这样的东西,只是别人的电脑
(这是一句俗语,上面的版本来自文章,由Hayato Huseman编写)
“云”只是用来表示数据存储在其他人的服务器上的一种奇特的方式。通常,您不知道服务器在哪里,而且它可以在不告诉您的情况下被移动。
如果您不想这样做,那么创建一个“私有云”,这只是一种表示您正在将数据存储在您自己的服务器上,在您自己的服务器空间中的一种奇特的方式。
https://softwareengineering.stackexchange.com/questions/402039
复制相似问题