首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏云计算教程系列

    如何在CentOS 7上使用InfluxDB分析系统指标

    此数据可能包含系统指标(如CPU和内存使用情况)和应用程序指标(如应用程序错误和REST端点调用)等项目。 系统运行的时间越长,累积的数据量就越大。InfluxDB提供了有效存储此数据的解决方案。 在本指南中,我们将介绍: 如何在CentOS 7上安装和配置InfluxDB。 如何将系统监视数据从collectd系统统计守护进程提供给InfluxDB。 sudo /etc/init.d/influxdb restart 接下来,让我们检查InfluxDB是否正在从collectd接收系统指标。 这是一个例子: 第7步 - 安装和启动Grafana 我们可以使用InfluxDB的Web界面来探索数据并从时间序列数据中可视化系统趋势。 在此步骤中,我们将创建一个系统概述仪表板,以显示我们在InfluxDB中收集的系统指标的趋势。 在Grafana中,仪表板是您工作的基本托盘。仪表板包含显示元素(例如图形和文本窗格)。

    4.6K10发布于 2018-09-19
  • 来自专栏云计算教程系列

    如何在CentOS 7上使用InfluxDB分析系统指标

    此数据可能包含系统指标(如CPU和内存使用情况)和应用程序指标(如应用程序错误和REST端点调用)等项目。 系统运行的时间越长,累积的数据量就越大。InfluxDB提供了有效存储此数据的解决方案。 在本指南中,我们将介绍: 如何在CentOS 7上安装和配置InfluxDB。 如何将系统监视数据从collectd系统统计守护进程提供给InfluxDB。 sudo /etc/init.d/influxdb restart 接下来,让我们检查InfluxDB是否正在从collectd接收系统指标。 这是一个例子: [InfluxDB示例内存使用结果集] 第7步 - 安装和启动Grafana 我们可以使用InfluxDB的Web界面来探索数据并从时间序列数据中可视化系统趋势。 在此步骤中,我们将创建一个系统概述仪表板,以显示我们在InfluxDB中收集的系统指标的趋势。 在Grafana中,仪表板是您工作的基本托盘。仪表板包含显示元素(例如图形和文本窗格)。

    4.2K30发布于 2018-09-20
  • 来自专栏云计算教程系列

    如何使用CentOS 7上的TICK堆栈监控系统指标

    您可以单独使用这些组件,但如果将它们一起使用,您需要拥有一个可扩展的集成开源系统来处理时间序列数据。 在本教程中,您将设置并使用此平台作为开源监视系统。当使用率过高时,您将收到电子邮件警报。 准备 在开始之前,您需要以下内容: 一个CentOS 7服务器,包括可以使用sudo权限的非root用户和防火墙。 如果您希望按照步骤7中的说明保护Chronograf用户界面,则需要一个GitHub帐户,该帐户是GitHub组织的一部分。 InfluxDB非常适合运营监控,应用程序指标和实时分析。 运行以下命令安装InfluxDB: $ sudo yum install influxdb 在安装过程中,系统会要求您导入GPG密钥。 第3步 - 安装和配置Telegraf Telegraf是一个开源代理,可以在其运行的系统或其他服务上收集指标和数据。然后,Telegraf将数据写入InfluxDB或其他输出。

    3.1K50发布于 2018-08-01
  • 来自专栏自然语言处理

    7个用于改进RAG系统的检索指标

    RAG通过访问非参数化记忆增强了LLM的参数化记忆 图片来源:https://medium.com/the-rag-explorer/7-retrieval-metrics-for-better-rag-systems-f04c098abbe7 检索指标 评估RAG(检索增强生成)系统的评价指标可以分为三大类: 用于信息检索任务的检索指标(本文重点讨论的内容) 生成特定指标,如BLEU、ROUGE、METEOR等,这些指标关注生成内容的流畅性, 接下来,我们将介绍七种流行的指标,它们不仅适用于RAG系统,还广泛应用于搜索引擎、推荐系统等信息检索任务中。 知识库的概念 在RAG中,知识库是一个非常重要的概念。 为你的知识库创建的Ground Truth数据可用于评估RAG系统。 前四个指标不考虑文档的排名。它们从整体检索角度评估系统的有效性。接下来的三个指标也会考虑结果的排名。 5. 7.

    2.1K10编辑于 2025-02-17
  • 来自专栏全球技术精选

    系统设计】指标监控和告警系统

    在本文中,我们将探讨如何设计一个可扩展的指标监控和告警系统。一个好的监控和告警系统,对基础设施的可观察性,高可用性,可靠性方面发挥着关键作用。 下图显示了市面上一些流行的指标监控和告警服务。 面试官:如果让你设计一个指标监控和告警系统,你会怎么做? 小明:好的,这个系统是为公司内部使用的,还是设计像 Datadog 这种 SaaS 服务? 面试官:很好的问题,目前这个系统只是公司内部使用。 小明:我们想收集哪些指标信息? 面试官:包括操作系统指标信息,中间件的指标,以及运行的应用服务的 qps 这些指标。 面试官:很好的问题,对于最新的数据,会保存 7 天,7天之后可以降低到1分钟的分辨率,而到 30 天之后,可以按照 1 小时的分辨率做进一步的汇总。 小明:支持的告警渠道有哪些? 另外,整体的系统也有较高的要求,要考虑到可扩展性,低延迟,可靠性和灵活性。 基础知识 一个指标监控和告警系统通常包含五个组件,如下图所示 1. 数据收集:从不同的数据源收集指标数据。 2.

    2.3K20编辑于 2022-09-05
  • 来自专栏开源心路

    数据中台-指标系统

    2.5 指标口径描述错误。 在流量分析数据产品中,有“7 日 uv”这个指标,口径的定义是 7 日内日均 uv。根据口径描述的计算逻辑,应该是最近 7 日,每日 uv 相加除以 7 取平均值。 显然,这个定义在业务场景中是有问题的,正确的 7 日 uv 的口径定义应该是 7 日内有登录过,去重的用户数。 2.6 指标命名难于理解。 2.7 指标数据来源和计算逻辑不清晰。 四.指标系统 指标系统是基于元数据中心构建的一个指标管理工具,它从元数据中心自动同步数仓的主题域和业务过程,按照规范化定义创建指标。 五.基于指标系统构建全局的指标字典 构建全局的指标字典分为两个场景: 一个是面对一个新的指标需求,如何基于指标系统完成指标开发流程; 另外一个是面对已经存在的,混乱的指标现状,如何进行全局梳理。 ; 按照指标系统指标的规范化定义,把整理好的指标录入指标系统

    1.6K30编辑于 2023-06-30
  • 来自专栏hotarugaliの技术分享

    推荐系统常用评价指标

    AUC AUC: Area Under ROC Curve,同目标检测中的 AUC 指标

    2K20编辑于 2023-05-16
  • 来自专栏AI系统

    【AI系统】关键设计指标

    AI 芯片设计的目标是低成本高效率的执行 AI 模型,所以衡量 AI 芯片的关键指标涉及 AI 模型软件应用层面的指标和 AI 芯片硬件市场竞争力指标两个方面,展开如下: 精度 Accuracy 在 系统价格 Cost 价格是市场选择 AI 产品时的重要考量指标。对搭建一个 AI 系统来说,要综合考虑硬件成本以及与之相关的系统集成和全栈生态系统的成本。 系统集成上下游全栈等成本:除了硬件本身的成本外,还需要考虑与 AI 芯片相关的系统集成和全栈生态系统的成本。这包括软件开发、算法优化、系统集成、测试验证、软件支持等方面的成本。 比如有 7 个计算任务,分给 4 个 PE 执行,则需要 2 个 cycle,但是其中有个 PE 的激活率是 50%,这种情况下的计算性能就没有达到峰值性能。 Step6, Step7:当计算平台自身提供的带宽有限,即使算力很多,内存空间很多,实际的仿真性能也不能更高了。

    60110编辑于 2024-12-04
  • 来自专栏秋枫学习笔记

    动手实现推荐系统评价指标

    . / len(user_pred[u][0]) return score / len(user_pred.keys()) 选择topk评价指标 def topk_metrics(y_true, y_pred

    76330编辑于 2022-09-19
  • 来自专栏服务端技术杂谈

    系统性能指标

    都在谈论高并发,但是高并发系统指标有哪些呢? QPS,TPS可以表明系统的吞吐; TP90可以表明系统的响应时间; 吞吐量重要参数:QPS(TPS),并发数,响应时间 QPS(TPS):每秒request/事务 数量 并发数:系统同时处理的request Collections.sort(times); return times.get(index); } 0.99 * 3 = 2.97 取整为3 第三个值为100ms 之后我们可以设置这个指标作为监控阈值

    1.7K30发布于 2018-07-23
  • 来自专栏知一杂谈

    分布式系统常用指标

    性能指标 吞度量 响应延迟 P95 P999 并发量 可用性指标 可提供的服务时间 / (可提供的服务时间 + 不可提供的服务时间) 请求成功次数 / 总请求次数 可扩展性指标 是否能实现水平扩展,通过增加服务器数量增加计算能力 存储系统中有两种扩展方式: Scale Out(也就是Scale horizontally)横向扩展,比如在原有系统中新增一台服务器。 一致性指标 实现多副本之间一致性的能力。不同的应用场景对于数据一致性指标要求不同,需要根据场景做具体的评估。

    43410编辑于 2021-12-07
  • 操作系统重点监控指标

    IPMI 可用于监控硬件的物理参数,如系统温度、风扇速度、电源电压等,可以有效地利用 IPMI 监控硬件温度、功耗、启动或关闭服务器和系统,以及进行日志记录。 IPMI 的一个主要亮点是,它的功能独立于服务器的 CPU 和操作系统。因为固件是直接在服务器主板上运行的,所以不管安装的操作系统是什么,它都可以用于管理各种远程位置的服务器。 而和 CPU 采集相关的配置实际只有一个,就是 collect_per_cpu,它用于控制是否采集每个单核的指标。默认值是 false,表示不采集单核的指标,只采集整机的指标。 硬盘 IO 相关的指标,主要关注读写延迟,所谓的 IO.UTIL 这种指标基本不用太关注。 7、processesprocesses 插件的配置文件在 input.processes 目录,默认不用调整。

    47110编辑于 2025-02-01
  • 来自专栏腾讯移动品质中心TMQ的专栏

    推荐系统相关效果评测指标总结

    三、评测方案指标总结 对于不同的推荐系统评测方式,我们需要使用不同的指标对其进行衡量: 1、模型离线实验 离线实验目的旨在对算法进行评价,所以评价指标强相关与所使用的推荐算法,传统的评分预测问题通常使用均方根误差 有些推荐系统也会像推荐广告系统或是学习排序算法一样使用pCTR或者Precision-Recall曲线评估推荐效果的优劣,所以评测推荐算法的指标较为复杂。 准确性指标: 推荐的准确度是评价推荐算法最基本的指标,在推荐系统中常用的准确度指标分为4类:预测评分准确率、预测评分关联性、分类准确率以及排序准确率。 2、ABtest在线实验 ABtest在线试验目的为根据线上真实用户指标数据对不同的算法进行评测,那么ABtest系统的评测指标就是线上真实用户数据指标,例如DAU、CTR、PV、UV、阅读时长、评论量 . 【3】朱郁筱,吕琳媛.推荐系统评价指标综述[J].电子科技大学学报,2012.

    9.7K31发布于 2018-12-25
  • 来自专栏云云众生s

    使用Thanos和Kubernetes构建指标系统

    指标是任何分布式系统中可观测性的支柱,在 Kubernetes 环境中,Prometheus 通常是……的工具。 本文探讨了如何在 Kubernetes 上使用 Thanos 构建一个健壮、可扩展且有弹性的指标系统,涵盖从设置到最佳实践的方方面面。 Thanos 和 Kubernetes 指标系统到底是什么? 使用 Thanos,您不仅仅是收集指标;您正在构建一个弹性系统,它允许您在分布式环境中存储和访问指标,而无需像以前那样独立管理多个 Prometheus 实例。 使用 Thanos 和 Kubernetes 构建的指标系统的组件 Thanos 不仅仅是一个工具——它是一套组件,它们协同工作以创建一个功能齐全的指标系统: Thanos Sidecar: 它与每个 当您有多个 Kubernetes 集群或区域并希望拥有统一的指标系统时,这尤其有用。

    90910编辑于 2024-09-25
  • 来自专栏TestOps云层

    测试人员7个悲剧且无用的kpi指标...

    测试指标应该始终是有意义的、可执行的。问题是有些测试指标无法达到这一目标。许多指标都是误导,有些只是稍微还有点价值,而有些则毫无意义。 7个无用测试指标还统计?把这篇文章给老板看看!尤其是第二点! 下面这些无用的测试指标的例子可以帮助你更好地判断,你现在所用的测试指标是否能够对软件质量彻底洞察。 3.通过率百分比 使用通过率作为度量指标这个主意不好,因为在软件开发团队中,很容易操纵这种指标——这是不鼓励的行为。 例如,测试团队可能会专注于执行更容易通过的测试,从而提高通过率。 换句话说,这个指标变化无常,易于操纵。 4.单元测试代码覆盖率 代码覆盖率是另一个常用的度量指标,但是这一指标常常被错误使用。 代码覆盖率是指单元测试覆盖的代码行百分比。 7.缺陷密度 缺陷密度是指软件中检测到的、得到确认的缺陷数量。通常认为较低的缺陷密度等同于较低的软件质量,但这并不是真的。

    1.2K20编辑于 2022-04-04
  • 来自专栏数据分析之旅

    数据指标体系搭建的7个思考点

    为了对现状进行监测和预警,我们常常会建立起一套数据指标体系,同时搭建和完善体系也应该是数据分析师的一项基本功,结合实际工作中经验,总结了这个搭建过程的7个思考点: 1. 目标       目标,不仅要求我们梳理好业务流程(例如常见的转化率漏斗、AARRR模块),也要求我们明确好目标受众对象,建立面向管理层的核心指标,面向业务部门的二级指标,面向个人KPI的三级指标,尽可能与 数据指标       数据指标,将业务问题量化为数字的变量。常见的有:数量、占比、比率等,一个好的指标通常是一个比率,因为这个比率通常可以连接分子、分母,而不是割裂来看 4. 数据字典       数据字典也是数据指标体系的一部分,可包括内容:指标名称、类型、统计周期、业务逻辑、数据源、数据逻辑等内容 7. 反馈闭环       数据指标体系的搭建不是一蹴而就的,需要结合业务部门的实际需求不断完善。

    1.1K31发布于 2020-08-13
  • 来自专栏自然语言处理

    你的RAG系统真的达标了吗?生产环境RAG成功的7大关键指标

    系统性能:整个RAG系统在成本和响应速度上表现如何? 7个你必须关注的指标 根据我的经验,要想打造一个成功的RAG应用,你得盯紧以下7个关键指标: Precision@k(我们拿到的是相关内容吗?) 虽然前面提到的7指标是认为必不可少的,但RAG系统的评估远不止这些。根据你的具体需求,还有很多其他指标可能会派上用场。 评估RAG系统,主要有两种方法: 确定性测量:这些指标可以直接从系统日志里算出来,比如延迟、令牌使用情况,还有召回率(前提是你有数据)。这类指标计算起来相对简单直接。 系统性能分析:接着检查延迟和令牌消耗,优化系统性能,降低成本。 迭代改进:最后根据指标不断调整系统,跟踪超参数的变化,持续评估和优化。 平衡评估成本:如果系统用的人少,搞太详细的指标可能不划算;但如果用的人多,没有合适的指标,成本反而更高。 跟踪超参数和指标的变化:记录实验配置,了解不同参数对指标的影响。

    1K10编辑于 2025-01-13
  • 来自专栏panzhixiang

    监控系统的四个黄金指标

    最近被问到一个问题,是关于监控系统的4个黄金信号(也被称为黄金指标)的,不太记得了,看了一些资料,做个笔记。 来源 监控系统的4个黄金指标来源于《SRE:Google运维解密》这本书的第六章 分布式系统的监控。 这一章讲了为什么要监控,黑盒监控与白盒监控,4个黄金指标,长尾问题,度量指标时应该采用合适的精度以及监控系统的长期维护这些问题,基本上构建一个监控系统比较重要的几个方面都有讲到。 应用这四个指标时需要注意的内容 延迟 监控 P50、P95、P99 等不同百分位数的延迟,以更全面了解系统性能。 应当区分成功请求和失败请求的延迟,以便更准确地诊断问题。 关注指标的分布而不是平均值 关注监控指标的分布而不是单纯的平均值,这是因为平均值往往不能全面反映系统的实际性能和用户体验,特别是在存在高可变性或异常的情况下。

    1.3K10编辑于 2024-10-30
  • 来自专栏量化投资与机器学习

    【Python量化投资】趋向系统指标策略 ADX、DMI指标用于股票池(附源码)

    [什么是ADX] ADX(average directional indicator) 平均趋向指数,常用的趋势衡量指标。 通常与趋向系统(DMI)一起使用,利用多空趋向之变化差离与总和判定平均趋势,ADX数值不能显示趋势的发展方向。 但是如果趋势存在,ADX可以衡量趋势的强度。

    5.1K60发布于 2018-01-29
  • 来自专栏漫漫架构路

    系统常用指标经验值(持续更新)

    系统常用指标经验值(持续更新) 一. 数据库相关 MySQL 单实例,读写 QPS 通常只有千级别(3000~6000),经过优化的查询语句,在性能较好的机器上,读 QPS可接近 1w。

    92010发布于 2020-09-07
领券