我使用深测井分析仪来监视我的网站访问。我现在注意到的是,有太多的流量报告比实际应该报告的基于谷歌的分析。我现在开始使用GA,但我需要根据iis的日志从2017年4月到2017年11月创建一份干净的报告。
我从IIS得到了所有的日志文件。但是现在我正在寻找一种方法来过滤垃圾邮件,比如/wp-之类的东西,并且只监视没有机器人和内部裁判员的“真实”访问者数据。
是否有任何更好的工具来进行这种日志报告,或者是否有方法来实现这个目标在深度日志分析器?
我试着过滤那些报告,但似乎仍然有太多的点击量。
我只需要以下信息:
总访问量、用户数量、平均会话时间和设备(如果是移动或桌面的话)
谢谢你的建议和帮助
编辑:我找到的最佳解决方案:http://www.weblogexpert.com/
发布于 2018-02-22 11:02:18
发布于 2020-06-17 13:11:37
您可以使用SpectX的免费版本来完成这一任务。下载并指向IIS日志文件夹。教程和示例查询:
分析IIS日志: Microsoft、OWA和ActiveSync活动
筛选出机器人的一个非常基本的方法是配置SpectX访问Maxmind的GeoIP数据库,然后使用filter_out命令。例如:
| filter_out(asname(c_ip) = ‘AS15169 Google LLC’ and cs_user_agent like ‘%Googlebot/%‘)
| filter_out(asname(c_ip) = ‘AS8075 Microsoft Corporation’ and cs_user_agent like ‘%BingPreview/%‘)
| filter_out(asname(c_ip) = ‘AS8075 Microsoft Corporation’ and cs_user_agent like ‘%bingbot/%‘)
| filter_out(asname(c_ip) = ‘AS32934 Facebook, Inc.’ and cs_user_agent like ‘%facebookexternalhi%‘)
| filter_out(asname(c_ip) = ‘AS14618 Amazon.com, Inc.’ and cs_user_agent like ‘%SMTBot/%‘)
| filter_out(asname(c_ip) = ‘AS714 Apple Inc.’ and cs_user_agent like ‘%Applebot/%‘)
| filter_out(asname(c_ip) = ‘AS13238 YANDEX LLC’ and cs_user_agent like ‘%YandexBot/%‘)
| filter_out(asname(c_ip) = ‘AS13238 YANDEX LLC’ and cs_user_agent like ‘%YandexMobileBot/%’)https://stackoverflow.com/questions/48925690
复制相似问题