我想知道所有数据库/数据库组合堆栈溢出在下面使用什么,管理各种垂直领域的大量用户配置文件信息。
以twitter和facebook等社交网站为例,大数据管理网络是通过hadoop完成的。堆栈溢出是否也可以处理如此大量的数据?
如何索引信息,redis是stackoverflow解决方案的一部分吗?
了解部署在世界上最流行的技术论坛上的解决方案将是非常有趣的。
发布于 2014-01-08 11:10:45
本文简要介绍了stackoverflow在2011年3月左右的架构:http://highscalability.com/blog/2011/3/3/stack-overflow-architecture-update-now-at-95-million-page-vi.html
在更高的层次上,它是一个.NET应用程序,它使用MS SQL server作为数据库,Redis用于缓存,HAProxy用于负载平衡,以及一系列的工具,并托管在windows服务器和linux服务器(ubuntu+centos)上。
在撰写这篇文章的时候,他们似乎还没有使用hadoop,但情况可能已经改变了。他们也可能正在为map/reduce类型的作业做一些不同的/定制的工作,或者可能根本不需要这样的东西。有了它,SQL服务器就可以扩展很多,而不需要依赖于“大数据”玩具。如果您可以将大部分数据从缓存层中提取出来,这一点尤其正确。
https://stackoverflow.com/questions/20963555
复制相似问题