我想构建一个类似Google的web应用程序,在该应用程序中,我收集客户最终用户的统计数据,并根据这些数据显示我的客户分析。
特点:
由于分析需要,我正在考虑使用OLAP/BI套件,但我不确定它是否适合这种规模。NoSQL数据库?简单的RDBMS就行了?
发布于 2010-12-16 09:14:20
这些是我在生产环境中使用的东西,它的作用就像一种魅力。
我做了三件事
PostgreSQL + LucidDB + Mondrian (更广泛地说是整个五旬斋BI套件组件)
我建议你看看整个五旬节BI套房,这是值得的,你可能想要使用其中的一些组件。
希望我能帮上忙
发布于 2012-06-12 20:40:36
有两种主要的架构你可以选择真正的网络规模:
1。"BI“架构
2."NoSQL“架构
不可变的事件存储区或记录器存在于此,因为在大多数情况下,您希望对分析事件进行批处理,并对数据库进行批量更新(即使使用HDFS之类的内容),而不是对每个页面视图执行原子写入等操作。
对于我们构建在Hadoop和Hive上的开源分析平台SnowPlow,事件日志都是在批量加载到Hive之前首先在S3上收集的。
请注意,"NoSQL体系结构“将涉及更多的开发工作。请记住,在这两种架构中,如果卷增长得非常惊人(每个客户的行数为数十亿行),您总是可以按客户进行拆分--因为没有必要(我猜)需要跨客户分析。
发布于 2010-12-17 04:14:14
我想说的是,OLAP分析总是很好,然后有很大的潜力使用MDX进行复杂的数据分析。
干杯。
免责声明:我会为我自己的解决方案做一些宣传-看看www.icCube.com,并联系我获得更多的细节
https://stackoverflow.com/questions/4458921
复制相似问题