首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >亚马逊档案数据的动态分析

亚马逊档案数据的动态分析
EN

Stack Overflow用户
提问于 2016-08-23 12:35:59
回答 1查看 604关注 0票数 0

背景

我发现可以用于流数据以及S3桶中的数据。

然而,动态文献的一些部分让我怀疑Analytics是否可以用于S3桶中的大量现有数据:

编写应用程序代码 我们建议如下:

  • 在SQL语句中,出于以下原因,请不要指定超过一个小时的基于时间的窗口:
代码语言:javascript
复制
- Sometimes an application needs to be restarted, either because you updated the application or for Kinesis Data Analytics internal reasons. When it restarts, all data included in the window must be read again from the streaming data source. This takes time before Kinesis Data Analytics can emit output for that window.
- Kinesis Data Analytics must maintain everything related to the application's state, including relevant data, for the duration. This consumes significant Kinesis Data Analytics processing units.

问题

会对这项任务有好处吗?

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2016-08-29 21:53:30

的主要用例是流数据处理。因此,您可以将应用程序附加到流数据源。您还可以选择包含来自S3的引用数据,此时该数据的大小限制为1GB。我们将把来自S3对象的数据加载到一个SQL表中,您可以使用该表来丰富传入流。

听起来,它需要一个更通用的工具,用于从S3查询数据,而不是流数据处理解决方案。我建议您看Presto和Amazon,而不是使用。

免责声明:我为Amazon Kinesis团队工作。

票数 3
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/39101400

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档