让我们假设我正在创建一个像instagram或facebook这样的社交网络,其中包含了大量的数据,我的需求是:
1:高可用性
2:数据挖掘和NLP (基本上与人工智能相关)
3:大量报告和汇总
4:搜索和关系ofc
我的问题是:
1:我需要使用哪些数据库?
2:如何存储数据以优化其搜索、数据挖掘和.
我不关心冗余或资源,我只是想有接近实时的结果。
发布于 2020-07-06 18:32:30
实际上,正确的答案取决于“兆字节”和“千兆字节”和“兆字节”的数据化。"Petabytes“实际上会占用大量的磁盘驱动器。还有成千上万的服务器。和很多负载均衡器,路由器等,一旦你添加HA,加倍一切(至少)。你的预算是怎样的?当磁盘驱动器发生故障时,有员工全职更换吗?
如果您想降低"petabytes“,并专注于其他请求之一的时间,我将乐意提供更多的细节。
https://dba.stackexchange.com/questions/270444
复制相似问题