我读过很多关于不同行业如何使用大数据分析的博客文章。但这些文章大多没有提到
我想知道是否有人能为我提供所有这些问题的答案或一个链接,至少回答一些问题。
如果有人能分享金融业是如何利用大数据分析的,那就太好了。
发布于 2014-06-11 07:48:45
你的问题很大,但我会尝试用我自己的经验来回答。
1 -这些公司使用了什么类型的数据?
Hadoop的优点之一是,您可以使用非常大的原始数据。它可以是.csv / .txt文件,json,mysql,照片,视频.
它可以包含有关营销、社交网络、服务器日志的数据.
数据的大小是多少?
这方面没有任何规定。它可以从50-60到1Po开始。取决于数据和公司。
2 -他们使用什么样的工具技术来处理数据
没有这方面的规则。视需要而定。为了组织和处理数据,他们使用Hadoop和Hive和Pig。为了查询数据,他们需要一些较短的响应时间,所以他们使用NoSQL /内存中的数据库和一个更短的数据集(由Hadoop改进)。在某些情况下,公司使用像Talend这样的ETL来加快速度。
3 -他们面临的问题是什么,以及他们所获得的数据是如何帮助他们解决这个问题的。
公司的主要问题是数据的增长。现在,数据太大了,不可能用Mysql或其他传统工具进行处理。例如,他们开始使用Hadoop。
4 -他们如何选择工具\技术来满足他们的需要.
我觉得这是内部问题。公司选择他们的工具是因为许可证的价格,他们自己的技能,他们的期末考试需要.
5 -他们从数据中识别出了什么样的模式&他们从数据中看到了什么样的模式.
我不太明白这个问题
希望它能帮到你。
发布于 2014-08-27 19:47:18
我认为,从不同的资源中一点一点地获取数据是一项困难的工作。只需确保访问以下链接:
一堆免费报告。我现在正在研究这份名单。http://www.oreilly.com/data/free/
著名的McKinsey报告:report.ashx
https://stackoverflow.com/questions/24155126
复制相似问题