首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >将数据从EC2 web服务器流式传输到红移

将数据从EC2 web服务器流式传输到红移
EN

Stack Overflow用户
提问于 2015-07-24 20:34:23
回答 3查看 202关注 0票数 0

我们希望将数据直接从EC2 web服务器传输到RedShift。我需要使用Kinesis吗?最佳实践是什么?在存储这些数据之前,我不打算做任何特殊的分析。我想要一个具有成本效益的解决方案(在加载之前使用DynamoDB作为临时存储可能会很昂贵)。

EN

回答 3

Stack Overflow用户

发布于 2015-07-25 06:28:36

如果成本是您最关心的问题,那么准确的记录数/秒与记录大小的组合可能很重要。

如果你谈论的是非常低的消息量,那么运行在t2.micro实例上的自定义应用程序来聚合数据是最便宜的,但它不会扩展。更大的缺点是您负责监视、维护和管理该EC2实例。

现代的方法是使用Kinesis + Lambda + S3 + Redshift的组合来拥有数据流,而不需要管理EC2实例!

在这篇博客文章中描述了这种方法:A Zero-Administration Amazon Redshift Database Loader

这篇博客文章没有提到的是,现在有了API Gateway,如果你确实需要做任何类型的自定义身份验证或数据转换,你可以通过使用Lambda将数据代理到Kinesis中,而不需要EC2实例。

这看起来像这样:

API Gateway -> Lambda -> Kinesis -> Lambda -> S3 -> Redshift

票数 1
EN

Stack Overflow用户

发布于 2015-07-24 22:43:19

Redshift最适合使用COPY command进行批量加载。典型的模式是将数据加载到DynamoDB、S3或Kinesis,然后在使用COPY to Redshift之前聚合事件。

另请参见this useful SO Q&A

票数 0
EN

Stack Overflow用户

发布于 2015-10-10 13:01:56

去年我使用Kinesis和Kinesis connector在我的公司内部实现了这样一个系统。Kinesis connector是亚马逊网络服务发布的一个独立应用程序,我们作为Kinesis消费者在一堆ElasticBeanStalk服务器上运行,然后连接器会每隔一段时间或每一次邮件聚合到S3上,然后它会触发Redshift的复制命令,定期将数据加载到Redshift中。由于它在EBS上运行,因此您可以调整自动缩放条件,以确保集群随着Kinesis stream中的数据量而增长和收缩。

顺便说一句,亚马逊网络服务昨天刚刚发布了Kinesis Firehose。我还没有玩过,但它看起来绝对像是Kinesis连接器的托管版本。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/31610681

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档