我有一个谷歌应用程序引擎应用程序,必须处理大量的数据收集。我收集到的数据每天大约有数百万条记录。在我看来,为了能够分析数据,有两种简单的方法来处理这个问题:
这样做有什么更好的方法吗?
谢谢!
发布于 2013-10-16 14:28:03
BigQuery有一个新的流API,他们声称它是为高容量的实时数据收集而设计的.
实践中的建议:我们目前正在通过方法1记录20M+多事件记录,如前所述。它运行得很好,除非没有调用批处理上传程序(通常每5分钟调用一次),那么我们需要检测这一点并重新运行导入程序。此外,我们目前正在迁移到新的流API,但还没有在生产中,所以我不能说它有多可靠。
https://stackoverflow.com/questions/19405003
复制相似问题