首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >基于.NET和Server的高通量日志记录体系结构

基于.NET和Server的高通量日志记录体系结构
EN

Stack Overflow用户
提问于 2012-02-10 08:46:09
回答 1查看 274关注 0票数 0

我需要记录向一系列网站提出的请求。当前的流量为每分钟1000次请求,但这只会增加。

有两种类型的请求,“已知”和“未知”--取决于饼干的存在。

最后,我想以以下形式获得日志:

对于未知数:

  • 每个地点每小时的访问次数

对于已知的人:

  • 每个地点每小时的访问次数
  • 每个用户的访问次数
  • 每个用户的最后访问时间

你的建议是什么来储存这个?

写操作需要非常快,所以我猜只是将所有数据转储到一个原始表中,并定期使用一个单独的进程/线程来解析它。

但是,在删除数据时不锁定表的“解析”原始数据的最佳方法是什么,从而阻止写入?

注:我要求的不是聚合SQL,而是关于如何保持它的快速性的技巧和过程,而不是阻止我没有想到的任何其他东西。

谢谢

EN

回答 1

Stack Overflow用户

发布于 2012-02-10 09:06:13

首先:我读到您正在专门寻找SQL答案。然而,我个人认为,这将不是你正在寻找的解决方案。

Hadoop这样的系统具有像地图/缩减这样的特性,特别是用来处理这种情况的数据。有各种各样的博客文章见。

Hadoop与日志文件分析还是这个用Hadoop进行日志分析和事件报告

一些优点:

  • 缩放Hadoop比使用RDBMS便宜得多。
  • 聚合可以分布在多台机器上。
  • map/reduce不需要预定义的结构。因此,如果有需求更改,您就不会注定要死。

如果您坚持使用SQL数据库,您将在以下问题中运行:

  • 在大多数情况下,以水平方式缩放RDBMs在聚合中需要花费时间。无论如何,水平缩放是不可能的。
  • 如果在一个或多个索引上具有定义良好的结构和聚合,则聚合仅从性能角度来看是快速的。
  • 您需要在更改数据结构的同时,使用大量操作来转换模型。
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/9225021

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档