我在Amazon中有3个表,其中包含用户使用应用程序的信息(基本上是屏幕单击、OS版本、应用程序版本等)。
我希望创建一个汇总表,它将存储每个用户的配置文件,包括“上次登录时间”、最近使用的App、最后一次访问屏幕等。
我对柱状数据库不太熟悉,以前只做过RDBMS的工作。我正在考虑编写一个cron作业,它将对过去一天的数据运行三个表的连接查询,并将结果合并到profile表中。我不知道红班是否能做到这一点。
发布于 2016-09-12 12:37:23
Amazon是一个完全兼容的SQL数据库。它是一个柱状数据库这一事实不应该影响您如何使用数据库--这仅仅意味着它在某些类型的操作中可以更快、更高效(例如扫描表格中的数百万行甚至数十亿行)。
运行常规数据库查询集的想法会很好。但是,为了提高效率,查询只应该更新自上次更新以来就有活动的用户的信息。也就是说,不要尝试更新有关所有用户的信息,因为大多数用户信息不会每天更改。
该查询基本上会说“为上次更新后访问系统的任何用户选择单击的最新值,os,版本”,而不是“为所有用户选择最新的单击,os,版本”。
另外,请考虑是否确实需要这样的表才能存在。也许,当您正在查找有关特定用户的信息时,可以立即检索该信息,而不是每天预先计算值。当然,这将取决于您希望检索此类信息的频率。
https://stackoverflow.com/questions/39443366
复制相似问题