首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏有困难要上,没有困难创造困难也要上!

    Prometheus学习之机器监控

    服务启动后,在浏览器通过访问 http://localhost:9090 来查看监控信息。 比如:输入 node_cpu_seconds_total{instance="localhost:9100",job="node"} 可以查看节点 CPU 监控指标。

    86610发布于 2020-02-18
  • 来自专栏蓝胖子的编程梦

    【升职加薪秘籍】我在服务监控方面的实践(3)-机器监控

    ,详细的展示如何对线上服务进行监控,内容涉及到的指标设计,软件配置,监控方案等等你都可以拿来直接复刻到你的项目里,这是一套非常适合中小企业的监控体系。 在前一节我们搭建好了监控组件,今天我们就来完成机器这一层次的监控。 对进程状态的监控除了上述监控指标外,我们还加上了对整个系统内部进程状态的监控,这是鉴于之前某些服务会产生异常子进程的情况才考虑添加的。主要对系统内各个时刻的进程状态进行监控计数。 总结在这一节,我们通过node exporter 建立起了对机器层级的监控,涉及cpu,内存,磁盘,网络,其中涉及的监控面板来自于现有的监控模板node exporter full,不过由于node exporter full 数量实在太多,我们挑选了一些组成了最终的监控模版,模版的json文件已经放到了文章开头, 你完全可以将它直接导入到你的grafana项目里,建立起对机器层级的监控

    60820编辑于 2023-08-23
  • 来自专栏开源部署

    监控自动化-自动添加业务机器

    这样我们就可以看到了 教学案例:通过自动发现自动添加业务机器 设置被监控机配置文件 配置自动发现发现主机 配置动作添加主机 1.1、设置被监控机配置文件 [root@node2 ~]# rpm -Uvh systemctl start zabbix-agent.service [root@node2 ~]# systemctl enable zabbix-agent.service 1.2、配置自动发现-发现机器 主机是发现了,但是并没有添加到监控队列中,原因是我们还没有设置要求监控平台将符合的机器加入监控队列。如果需要设置,就要通过配置—动作 来完成。 1.3、配置自动发现动作,实现机器自动添加到监控队列 为了让发现的机器自动添加到监控队列,需要在zabbix-server监控平台设置动作来完成添加。 选择操作来定义如何将符合条件的机器加入到监控队列 注意操作选项,我添加了四个动作: 添加主机 添加到主机群组 链接到模板 启用主机 顺序不能错的,大家想想是不是我们手动添加也是这个顺序啊

    48220编辑于 2022-09-15
  • 来自专栏DT数据侠

    AI戒毒:被机器监控的毒品“心瘾”

    (图片说明:左图为吸毒人员使用毒瘾渴求度评估系统的场景概念图,右图为实景图) 2018年,北京宣布首次将AI应用于戒毒领域,利用机器学习和大数据交互信息,帮助“瘾君子”成功戒毒,辅助戒毒人进行各方面评估 所谓的AI戒毒其实是利用人工智能机器学习技术,通过便携式精准采集脑电(EEG)、皮肤电(GSR)、心率(HR)等生理数据,对戒毒人员多维度的生理数据进行深层次挖掘,实现对毒瘾渴求的准确客观预测。 这是一项基于千人样本的毒瘾渴求度评估测试,李岱介绍到,他们进行了一系列的研究和探索,在初步的机器学习模型中,已达到较高准确度的客观毒瘾渴求度动态评估。 通过在虚拟环境中给其场景刺激来监测生理数据的变化,比如通过高度还原酒店、KTV等吸毒场景,观察被监测人的生理数据的变化,经过机器学习对大量数据进行清洗和提取,最终完成毒瘾渴求度预测工作。 随着非侵入式的脑机接口技术的发展,可通过智能穿戴设备采集毒品成瘾者在面对毒品相关线索时神经元的放电状态,并利用机器学习构建成瘾的学习模型,在实施监测发现其渴求度增高时,可精准调控成瘾复吸相关的神经元及神经环路的活动性

    1.7K10发布于 2019-01-23
  • 来自专栏机器人网

    机器人速度与分离监控实例

    人机协同作业 在同一个协同空间内,机器人和操作人员是允许同时在空间内进行移动的。但为了保障操作人员的安全,需要通过安全技术检测人员和机器人之间的距离。 根据人员和机器人之间的距离,系统通过控制机器人的速度产生相应变化,最终在碰撞产生之前停止机器人。当操作员离开时,机器人系统可以根据需要手动或自动恢复原有运动路径,同时保持最小的距离间隔。 这样的速度与分离监控在ISO/TS 15066中被认为是4种人机协作的安全应用之一。 ? 速度与分离监控示意图 速度与分离监控实例 为了形象地展示速度与分离的监控,皮尔磁搭建了一套基于SafetyEye的监控系统来展示这种类型的应用。 在上面的人机速度曲线图中,系统在发出停机指令到机器人接收指令之间具有一段响应延迟;同时机器人开始减速到停机同样也具有相当的时间间隔。

    74220发布于 2018-07-23
  • 来自专栏高速公路那点事儿

    隧道机器人 | 巡检机器人系统设计篇-监控平台

    机器监控平台主要实现多隧道机器人控制及视频监控功能,包括巡检方案制定、巡检方案下发、环境信息检测、视频监控、统计分析等。 平台一般提供隧道数据展示、隧道运行状态检测、智能运营、人机联动、事件管理、环境监控等功能,还会根据情况触发预警通知 由于其功能设计不复杂,所以我们可以直接参考其他公司的现有产品学习一下,然后整理如下平台功能 管理人员可以通过语音功能以及实时监控功能对隧道内事故现场进行指挥调度,隧道现场人员也可以及时反馈现场情况,开展应急救援。 巡检任务功能 提供定时巡检计划编制功能、巡检任务报告功能等。 事件管理功能 实现机器人采集的各类事件及报警信息的管理功能,包括传感器报警、交通事件报警、隧道结构报警、机电设备报警、机器人本体报警等。 巡检记录表如下: 通讯协议设计 监控平台最主要的就是标准化通讯协议,应支持TCP/IP、MQTT和WebSocket等多种通信协议,能够实现实时数据传输,确保信息及时更新与交换。

    55410编辑于 2025-07-03
  • 来自专栏Windows技术交流

    腾讯云VPC机器,安装监控组件没图像

    首先确保不是安全软件拦截云监控组件,然后继续。 安装监控组件后续用等5分钟左右才会有图像,刚买下机器,灰色转圈刚变成绿色运行中就立即查看监控会提示没安装监控组件,腾讯云控制台这个逻辑有问题,即便买机器时选了带监控组件。 如果没有,那就需要确认监控组件运行状态如何了。 要确保监控相关的内网域名解析没有问题,如果是DNS解析内网域名出了问题,可以直接在hosts写死内网域名的IP,这样就不会受修改DNS影响内网服务了(内网域名解析有问题会影响kms激活、ntp校时、内网镜像服务

    2.2K10编辑于 2022-10-11
  • 来自专栏西城知道

    使用云监控创建一个云监控钉钉机器人【教程】

    支持多项阿里云服务的文档状况检测,还支持包括邮件、短信、钉钉机器人等多样化的报警功能。 不过别忘记设置报警人的联系方式,比如说手机、邮箱和钉钉机器人。 创建云监控钉钉机器人 选择很多的运维群组都是使用钉钉进行 5*8 进行沟通交流的,如果有一个可以对服务状态进行报警的钉钉机器人就可以更加的高效,用户和运维者都可以做到及时的获得通知。 那么我们就来创建一个钉钉机器人吧。 在 群设置 选择 群机器人 ,然后 添加机器人 选择 自定义。 然后发挥想象力想一个名字出来,接着复制 hook 地址就行。 spm=5176.2020520111.123.1.39f8d103fqE4mf 然后我们到 报警联系人 —— 新建联系人 那里添加联系人名称和钉钉机器人即可。

    3.9K80发布于 2019-01-26
  • 来自专栏机器学习AI算法工程

    基于机器学习的GitHub敏感信息泄露监控

    这个问题有时很难完全规避掉,为了降低可能的恶劣影响,一般都是会内部搭建一个GitHub敏感信息泄露的监控系统。 后来,我在互联网上看到有关机器学习技术的文章,就想尝试用机器学习的方式去解决下工作痛点。 我们的样本文件集,数量越多,质量越好,产出的机器学习模型也就越高效和精准。就好像人读书越多越聪明一样。 在前期,当我们的样本集具备基本的可用性的时候,实际上就已经能够很好的运行了,随着工作的进行,收集到的样本会越来越多,对机器学习模型的训练也就越来越容易。 结束 因为我自身的工作主要是渗透测试方面。 程序开发经验和对机器学习算法的理解都十分匮乏,所以历时很久,参考了网上各路大神的资料之后,反复测试迭代,才搞到现在这个效果,能够很好的解决自身的这个工作需求。

    1.4K30编辑于 2021-12-05
  • 来自专栏machine_learning

    机器学习模型的特征监控方案设计

    为什么要做特征监控 举一个例子: 眼看着双十一快要到了,公司要做大促,实现留存拉新的目标,但面临一个棘手的问题:总是有专业羊毛党来薅羊毛。 由于我们不能忽视预测质量的下降,所以我们需要持续监控已经部署的机器学习模型。当我们在某些领域开展业务时,往往面临的一个挑战是,我们模型的预测结果具有迟滞性。 因此,需要监控实时流量中特征分布与模型评估测试集中特征分布之间的相似性,从而能够立即发现并评估模型的输入特征是否发生了重大变化。 3. 监控方案的设计 3.1 确保输入特征的分布(总是)与训练时特征的分布相同 这里是通过KS-检验实现。 3.2 数据聚合的窗口大小的设计 ? 3.4 监控界面设计 实际上,监控界面的设计和普通BI系统的区别不大。

    2.6K40发布于 2020-09-09
  • 来自专栏西城知道

    使用云监控创建一个云监控钉钉机器人【教程】

    支持多项阿里云服务的文档状况检测,还支持包括邮件、短信、钉钉机器人等多样化的报警功能。 不过别忘记设置报警人的联系方式,比如说手机、邮箱和钉钉机器人。 创建云监控钉钉机器人 选择很多的运维群组都是使用钉钉进行 5*8 进行沟通交流的,如果有一个可以对服务状态进行报警的钉钉机器人就可以更加的高效,用户和运维者都可以做到及时的获得通知。 那么我们就来创建一个钉钉机器人吧。 在 群设置 选择 群机器人 ,然后 添加机器人 选择 自定义。 然后发挥想象力想一个名字出来,接着复制 hook 地址就行。 spm=5176.2020520111.123.1.39f8d103fqE4mf 然后我们到 报警联系人 —— 新建联系人 那里添加联系人名称和钉钉机器人即可。

    1.7K10发布于 2020-01-19
  • 来自专栏高速公路那点事儿

    隧道机器人| 巡检机器人系统设计篇-搭载系统(监控设备)

    巡检机器人的搭载设备是根据现场需求来设定,不是什么都需要上,根据隧道的实际环境进行相关搭配。 目前的搭载设备包括摄像机、雷达及传感器等等。 本文简单说一下监控设备: 云台摄像机 云台摄像机主要是用于巡检任务预置位调用,还有就是人工远程操控,查看现场情况使用。 大部分隧道为单向2车道,个别隧道为3车道。 固定摄像机 固定摄像机固定安装在摄像机前方,需要将轨道纳入监控场景,同时完成对道路的监控。 为了轻量化设计的目标,可以采用车载网络摄像机,这样可以小巧而轻量化。 拾音设备 采集现场声音,实现现场环境和视频监控的声音采集。 本项目拾音设备选用防暴高保真降噪拾音器,其特性如下: 专业录音采访全向音头,50平方高保真、高灵敏、高带宽、无噪音。 在机器人的头尾两侧分别装两个低成本激光雷达测距模组(如图)探测距离,在运行时检测到障碍物时触发巡检机器人报警并减速/急停,保证吊轨式巡检机器人安全作业。

    28900编辑于 2025-07-03
  • 来自专栏IT运维技术圈

    系统监控及钉钉机器人告警脚本

    ${Dingding_Url} -H 'Content-Type: application/json' -d '{ "msgtype":"text", "text":{"content":"服务监控 Host_name=`hostname` IP_addr=`ifconfig $ifconfig | grep "inet" |awk 'NR==1{ print $2}'` #【配置4】中间件监控项 按照自己需求配置即可,同上 # flink_status=`netstat -lntup |grep -w "$Port_flink" |wc -l`':flink' #【配置5】钉钉webhook,此处为添加的钉钉机器人 Dingding_Url}" -H 'Content-Type: application/json' -d " { 'msgtype': 'text', 'text': {'content': '服务监控 Dingding_Url}" -H 'Content-Type: application/json' -d " { 'msgtype': 'text', 'text': {'content': '服务监控

    76010编辑于 2022-10-24
  • 来自专栏Zabbix中国官方

    【Z投稿】如何使用文件方式管理各个机器的端口监控

    今天带来的是来自 Zabbix高级认证专家——张宇的投稿 如何使用文件方式管理各个机器的端口监控 ? 前提 很多时候由于机器多。加上端口分布在各个OS机器上。对于监控管理起来是一件非常困难的事情。 我们可以使用一个文件管理所有机器的端口。执行机器可以是任何被监控的Linux OS主机。 1.1 脚本配置 vi protlist1.sh #! 点击查看大图 配置监控项: 其中{#PORT}和{#IP}键值宏是脚本里定义的。 ? 点击查看大图 Zabbix自动生成监控项,在前端。 ? 点击查看大图 最后查看最新数据配置告警触发器等。 1.5 维护 由于我们使用执行机形式监控端口。所以最后我们只需要维护文件里的规则就好了。我们最后增加或者删除都很方便操作。最终Zabbix前端监控项会根据文件里的记录来自增或者自减监控项。

    84630发布于 2021-02-03
  • 来自专栏木头编程 - moTzxx

    企业微信,实现群机器监控线上服务报警

    背景 近期在对项目优化过程中 注意到:当前的报警信息都是通过邮件发送,一方面时效性比较低,另外实现方式比较复杂 通过同事,了解到 企业微信群机器人 实现起来简洁方便 在此,记录一下我的实现步骤 欢迎指摘 … 【注】: 当前为 PHP 实现方式,可根据自己的语言灵活对接 详细描述,请参考开发文档: 【 >>>如何使用群机器人 】 如何使用群机器人 在终端某个群组添加机器人之后, 创建者可以在机器人详情页看的该机器人特有的 : ② 添加完成后,可复制地址,用于业务接口的调用 注意: 一定要保护好机器人的 webhook地址,避免泄漏! 不要分享到github、博客等可被公开查阅的地方,否则坏人就可以用你的机器人来发垃圾消息了。 //发送企业微信通知 ③ 接口调用,结果: ---- ▷ 附录: 其他的监控实现,可参考文章:【用企业微信监控线上服务报警】 markdown 类型的样式实现 当前测试,只是做了最简单的

    2.1K30编辑于 2022-06-27
  • 来自专栏CNCF

    成员网研会:使用机器学习进行自主日志监控(视频+PDF)

    机器学习可用于自动检测异常日志模式,并将其与根本原因关联起来。 在本次网络研讨会中,我们将讨论并演示一种方法,利用无监督机器学习来组织和分类流式日志事件,然后学习正常和异常日志模式。

    59310发布于 2020-02-20
  • 来自专栏ShowMeAI研究中心

    机器学习模型流程与效果监控

    图片本文讲解如何使用whylogs工具库,构建详细的AI日志平台,并监控机器学习模型的流程与效果。 --- 作者:韩信子@ShowMeAI 机器学习实战系列:https://www.showmeai.tech/tutorials/41 本文地址:https://www.showmeai.tech/article-detail /395 声明:版权所有,转载请联系平台与作者并注明出处 收藏ShowMeAI查看更多精彩内容图片完整的机器学习应用过程,除了数据处理、建模优化及模型部署,也需要进行后续的效果验证跟踪和ML模型监控—— 详见ShowMeAI的文章 机器学习数据漂移问题与解决方案。ShowMeAI在这篇文章中,将给大家展示如何使用开源工具库 whylogs 构建详尽的 AI 日志平台并监控 ML 模型。 监控模型性能指标前面看到了如何监控模型输入和输出数据,我们还可以通过在预测结果来监控性能指标,例如准确度、精确度等。

    780152编辑于 2022-11-28
  • 来自专栏C博文

    机器学习模型监控警报系统设计:Prometheus+Evidently 实战教程

    系统架构设计:从数据采集到智能告警 (1)监控系统核心组件交互图 图解:系统采用双引擎架构,Prometheus负责基础监控指标采集与告警触发,Evidently执行深度模型分析,两者通过时序数据关联实现精准问题定位 (2)关键技术选型矩阵表 组件 技术选型 核心功能 优势特性 监控存储 Prometheus 时序数据存储/查询 高维数据压缩、PromQL灵活性 模型分析 Evidently 数据漂移检测/性能评估 监控指标体系构建方法论 (1)模型健康度评估模型 计算公式: HealthScore=0.4⋅Accuracy+0.3⋅DataDriftScore+0.2⋅Latency+0.1⋅ErrorRate 高可用架构设计 (1)监控系统拓扑图 图解:采用Thanos实现全局视图,配合远程存储解决Prometheus本地存储限制,确保99.99%可用性。 实战案例:信用卡反欺诈模型监控 (1)业务场景指标体系 监控重点: 欺诈检出率(FDR) 误报率(FPR) 交易拦截延迟 (2)异常检测效果对比 检测方法 召回率 误报率 检测延迟 静态阈值 72% 18%

    26010编辑于 2025-07-15
  • 来自专栏Vue源码 & 前端进阶体系

    【前端监控】页面错误监控

    一个多级不判空取值就很可能导致严重的白屏bug 你以为这种错误很少吗,就我们团队就这种bug就出现好多次,被大佬骂惨了,看看我们现在线上监控到的错误 一大半都是 of undefined,of null PAGE_ERROR/index.js:87:1" 可以看到所有的函数调用栈,getuserInfo 和 JSError 上报什么数据 除了我们常规的上报基础数据 如你上面看到的数据,都需要上报上去 可以看一下我们监控系统最终上报的数据 ,具体可以看 【前端监控】静态资源测速&错误上报 这里再简单描述下 前面我们用window.onerror 来监听js执行错误,但是它并不能获取到资源加载失败的错误,因为这些错误不会向上冒泡,但是我们可以进行捕获 所以我们这里只监听资源错误就好了 window.document.addEventListener('error',handler, true) 请求报错 请求报错的内容,也已经写过,具体可以参考 【前端监控 最后可以看下我们对于线上页面监控的一个异常数据对比图,大概长这样(数据是假的) 可以很清楚看到线上页面的稳定性,一个字,稳 最后 鉴于本人能力有限,难免会有疏漏错误的地方,请大家多多包涵, 如果有任何描述不当的地方

    2.8K10发布于 2021-09-09
  • AirPods 监控头部运动,同步大象机器人myCobot 280协作机械臂

    原文链接:AirPods → iPhoneアプリ → Express → python-shell → pymycobot → myCobotと繋いでいって、AirPodsの回転角とmyCobotの姿勢と同期する 🤖 - みかづきブログ・カスタム

    95510编辑于 2024-02-26
领券