CoovallyAIHub

文章/答案/技术大牛

发布

LV0

全部文章

ICLR 2026 | MedAgent-Pro：用 Agent 工作流模拟临床医生的循证诊断过程
多模态大模型（MLLM）在医学影像诊断上有一个根本性矛盾：它们能"看"图像、能"说"结论，但做不好临床诊断中最关键的一步——定量分析。测量杯盘比、计算射血分数、...
CoovallyAIHub 21小时前2026-03-20 14:43:11
计算机视觉、深度学习、机器学习、人工智能、算法
智谱 GLM-OCR：0.9B 小模型登顶 OCR 榜单，3月起还能一行代码接入 Agent
文档 OCR 领域正在经历一场参数量军备竞赛——Qwen3-VL 用 235B 参数拿到 89 分，Gemini-3 Pro 拿到 90 分。但 OmniDoc...
CoovallyAIHub 21小时前2026-03-20 14:26:07
深度学习、机器学习、人工智能、算法、计算机视觉
中文语音识别该用谁？6 个开源模型 + 2 个配套工具，一文理清
中文语音识别的开源方案越来越多，但它们不在同一个层面上——有的是模型，有的是工具包，有的是部署运行时。直接把它们摊在一张表里比"谁更好"，容易越看越糊涂。本文把...
CoovallyAIHub 22小时前2026-03-20 14:01:23
机器学习、算法、计算机视觉、人工智能、深度学习
Django 大佬亲授：8 个 Coding Agent 工程模式，重新定义程序员价值
重构一个模块，过去要半天；现在一个 agent 会话，5 分钟。给项目补全测试，过去"不值得花时间"；现在 agent 跑一遍，1 分钟。当写代码的成本从小时级...
CoovallyAIHub 1天前2026-03-20 10:14:35
代码优化、程序员、测试策略、工程化、人工智能
无人机 RGB+热红外融合检测建筑裂缝与渗漏，34 层高楼约 2 小时
住宅建筑的外立面检测传统上依赖人工——爬脚手架、挂绳索、拿检测仪逐面墙检查。一栋 34 层高楼，人工检测需要 2-3 天，覆盖率只有 40-60%，而且肉眼看不...
CoovallyAIHub 1天前2026-03-20 09:36:46
智慧建筑、智慧城市、人工智能
BMW GenAI4Q：每57秒下线一辆车，AI如何为每辆车定制专属质检清单
AI 做工业质检，大多数人想到的是摄像头+深度学习自动识别缺陷。但 BMW 在 Regensburg 工厂做了一件不一样的事：不是用 AI "看"缺陷，而是用生...
CoovallyAIHub 2天前2026-03-18 13:24:27
汽车智能网联、人工智能
南大MOTIP：多目标跟踪不再需要复杂匹配规则，简洁方法效果更优
多目标跟踪（MOT）的主流做法是"检测+关联"：先检测出每一帧的目标，再用匈牙利算法、IoU 匹配等手工设计的启发式方法把前后帧的目标对应起来。这些方法能用，但...
CoovallyAIHub 3天前2026-03-18 11:41:54
人工智能、检测工具
东南大学提出 AutoIAD：多 Agent 驱动的工业异常检测自动化框架
工业异常检测（IAD）从数据准备到模型训练，每一步都需要大量人工介入。现有的通用 Agent 框架（如 openHands、openManus）虽然能写代码，但...
CoovallyAIHub 3天前2026-03-17 14:35:13
人机协作、人工智能、工业物联
CVPR 2026 | VisualAD：去掉文本编码器，纯视觉也能做零样本异常检测
做零样本异常检测，一定要用文本提示吗？VisualAD 给出了一个意外的答案：把 CLIP 的文本编码器整个去掉，只靠两个可学习的视觉 token，参数量砍掉 ...
CoovallyAIHub 3天前2026-03-17 14:34:53
大模型部署、人工智能、工业互联网
开源一周 6300+ Star！Andrew Ng 发布 Context Hub，专治 AI Agent 调用过时 API
使用 AI Agent 编写代码时，您大概遇到过情况：Agent 生成的代码调用了一个已经废弃的 API 版本，或者用了最新版本中的一个参数名称已经修改了。您花...
CoovallyAIHub 3天前2026-03-17 14:25:02
框架、云 API、开源
FunASR：几行代码搞定语音识别全流程的开源工具包，GitHub已获15.2k Star！
语音识别（ASR）是人工智能落地最广泛的方向之一，但学术界的前沿模型与工业界的实际部署之间一直存在距离。
CoovallyAIHub 4天前2026-03-17 10:11:36
人工智能、算法、计算机视觉、深度学习、机器学习
RF-DETR：最近一个月迭代 5 个版本的实时检测+分割模型
实时目标检测长期由 YOLO 系列主导，Transformer 架构因推理速度劣势一直难以进入实时场景。
CoovallyAIHub 4天前2026-03-17 09:46:55
深度学习、机器学习、人工智能、算法、计算机视觉
PaveSync：跨国5.2万张图像路面病害基准，7款模型横评（YOLOv8-v12+Faster R-CNN+DETR）
路面病害检测领域长期缺乏统一的大规模基准数据集，各研究使用不同数据源、标注格式和类别定义，导致模型间难以直接比较。
CoovallyAIHub 5天前2026-03-16 10:09:49
人工智能、算法、计算机视觉、深度学习、机器学习
当LLM智能体走出数字世界：日立提出分层框架实现无人机自主工业巡检
将 LLM 智能体框架应用于无人机物理巡检是一个新兴方向，但不同推理方法在实际任务中的表现差异尚不清楚。
CoovallyAIHub 5天前2026-03-16 09:55:53
机器学习、算法、计算机科学、计算机视觉、深度学习
中山大学联合中国电建：基于大疆M300无人机自动巡检风电叶片，120次实飞成功率98.3%
风电叶片在恶劣天气下易受损，需定期巡检。传统方式依赖人工操作，效率低且存在安全风险；现有无人机自动巡检方案则面临两个难题——叶片停止角度估计易受背景干扰，拍摄过...
CoovallyAIHub 5天前2026-03-16 09:43:27
人工智能、算法、计算机视觉、深度学习、机器学习
ICLR 2026 | 慕尼黑工大院士Navab团队联合MVTec提出FoundAD，用基础视觉编码器实现少样本异常检测
少样本异常检测（Few-Shot Anomaly Detection）是工业质检领域的核心需求——在仅有极少量正常样本的条件下，模型需要准确识别并定位缺陷。现有...
CoovallyAIHub 7天前2026-03-13 14:09:46
算法、计算机视觉、人工智能、深度学习、机器学习
纯合成数据训练，真实图像Pose mAP达0.97：亚琛工大用YOLOv11实现风电关键点检测
【导读】自主无人机巡检风电叶片时，需要准确检测风机及其关键特征（叶尖、塔顶、轮毂等）来实现安全定位和避障。然而，现有方法依赖人工标注的真实图像，在天气、光照、...
CoovallyAIHub 7天前2026-03-13 13:19:59
算法、计算机视觉、深度学习、机器学习、人工智能
准确率超90%，成功、故障、异常一步区分：世界模型+四足机器人的仪表巡检方案
【导读】工业巡检机器人在执行仪表读数任务时，经常面临遮挡、视角不佳、光照异常等问题，导致读数失败甚至误读。如何让机器人在运行时自动识别"成功读取""已知故障"...
CoovallyAIHub 7天前2026-03-13 13:13:39
人工智能、深度学习、边缘计算机器、机器学习
AI 代理替你下单，平台能说“不”吗？——亚马逊诉 Perplexity 案解读
编译按：本文基于 Forbes 撰稿人 John Koetsier 2026 年 3 月 10 日的报道编译与评论。原文信息详见文末出处。
CoovallyAIHub 8天前2026-03-13 11:57:48
agent、大模型安全网关、安全漏洞、openapi
ICLR 2026 | MRAD：不拟合直接查表，零样本工业缺陷检测新范式，16 数据集均值最优
MRAD 另辟蹊径——冻结 CLIP 编码器，构建双层特征-标签记忆库，推理时直接相似度检索得到异常分数，无需参数拟合。基于此衍生三个递进变体（MRAD-TF ...
CoovallyAIHub 8天前2026-03-12 14:02:07
机器学习、人工智能、算法、计算机视觉、深度学习

12 3 4 5 6 7 8...21 下一页

个人简介

暂未填写公司和职称
专注开源社区深度解读，带你了解最新科技趋势，洞悉未来发展！
暂未填写技能专长
暂未填写学校和专业
暂未填写个人网址
江苏省 | 南京市
加入社区时间：2024-12-31

个人成就

获得 457 次赞同
文章被阅读 328.8K 次
文章获得 1 次首页推荐

关注了：0关注者：36

CoovallyAIHub

全部文章

ICLR 2026 | MedAgent-Pro：用 Agent 工作流模拟临床医生的循证诊断过程

智谱 GLM-OCR：0.9B 小模型登顶 OCR 榜单，3月起还能一行代码接入 Agent

中文语音识别该用谁？6 个开源模型 + 2 个配套工具，一文理清

Django 大佬亲授：8 个 Coding Agent 工程模式，重新定义程序员价值

无人机 RGB+热红外融合检测建筑裂缝与渗漏，34 层高楼约 2 小时

BMW GenAI4Q：每57秒下线一辆车，AI如何为每辆车定制专属质检清单

南大MOTIP：多目标跟踪不再需要复杂匹配规则，简洁方法效果更优

东南大学提出 AutoIAD：多 Agent 驱动的工业异常检测自动化框架

CVPR 2026 | VisualAD：去掉文本编码器，纯视觉也能做零样本异常检测

开源一周 6300+ Star！Andrew Ng 发布 Context Hub，专治 AI Agent 调用过时 API

FunASR：几行代码搞定语音识别全流程的开源工具包，GitHub已获15.2k Star！

RF-DETR：最近一个月迭代 5 个版本的实时检测+分割模型

PaveSync：跨国5.2万张图像路面病害基准，7款模型横评（YOLOv8-v12+Faster R-CNN+DETR）

当LLM智能体走出数字世界：日立提出分层框架实现无人机自主工业巡检

中山大学联合中国电建：基于大疆M300无人机自动巡检风电叶片，120次实飞成功率98.3%

ICLR 2026 | 慕尼黑工大院士Navab团队联合MVTec提出FoundAD，用基础视觉编码器实现少样本异常检测

纯合成数据训练，真实图像Pose mAP达0.97：亚琛工大用YOLOv11实现风电关键点检测

准确率超90%，成功、故障、异常一步区分：世界模型+四足机器人的仪表巡检方案

AI 代理替你下单，平台能说“不”吗？——亚马逊诉 Perplexity 案解读

ICLR 2026 | MRAD：不拟合直接查表，零样本工业缺陷检测新范式，16 数据集均值最优

个人简介

个人成就

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐