我们计划转向amazon-redshift对于我们的数据仓库解决方案,我们需要建立一个从mysql到redshift的增量管道,它还可以处理更新,什么是最有效的方法来做到这一点?
发布于 2014-12-19 07:58:34
对于从MySQL到RedShift的数据同步,您可以尝试使用亚马逊网络服务数据管道。
发布于 2014-12-29 18:05:03
您可以使用市场上现有的一些解决方案,如http://www.bryte.com.au/solutions/amazon-redshift-integration/。否则,您将需要实施触发器和AWS数据管道。
发布于 2015-01-03 20:16:10
选项1:定期从MySQL表中读取后台数据并写入红移。在这里,无论何时进行定期读取,您都将在MySQL DB上创建峰值负载。此时,对于其他在线用户来说,MySQL DB将变得很慢。
选项2:使用选项1但更好的方式,修改额外的标志和列的MySQL架构表,并让多线程后台程序以更有效的方式从MySQL表上读取MySQL表。
选项3:经济有效方式,使用S3作为中转区,修改写入MySQL的程序,让该程序也写入S3位置。您可以在后台运行自定义java程序,该程序将定期从S3同步到Redshift。使用数据管道将是代价高昂的选择,同时也会给MySQL DB带来极大的负载。
选项4:Attunity Cloud Beam
选项5: AWS数据管道
选项6: AWS lambda函数
https://stackoverflow.com/questions/27544237
复制相似问题