时间序列数据库可以完成流分析系统(如spark streaming / flink / kinesis analytics)所能做的一切吗?
其中一个包含另一个吗?我并不是在寻找哪一个更好。只需了解它们支持哪些不同的用例。
发布于 2017-10-22 09:11:17
时间序列数据库专注于以比我们常见的关系数据库更高性能的方式存储和检索基于时间的条目。最近,考虑到业界对高性能事件处理的兴趣,它们再次成为热门话题。目前,它们大多依赖于特定的NoSQL数据库索引技术,如OpenTSDB (HBase)、InfluxDB (BoltDB)等。
另一方面,Spark Streaming等分布式流处理框架是基于对数据流管理系统的研究,提供了更灵活的事件分析方法。它们通常用于进行其他类型的数据分析,如基于流的机器学习、草图、窗口以及应用多种其他技术,这些技术不是时间序列数据库的重点。
它们都起源于21世纪初对时间序列数据库和数据流管理系统的研究,因此它们的许多特性和体系结构思想被应用到另一个上,反之亦然。这方面的一个例子是开创性的流处理论文“数据流上的连续查询”(S. Babu,2001)引用时间序列数据库作为相关工作的示例。
https://stackoverflow.com/questions/45745718
复制相似问题