首页
学习
活动
专区
圈层
工具
发布
首页标签计算机视觉

#计算机视觉

AI驱动行业监管升级:特种行业许可证识别系统的技术架构与优势

中科逸视OCR专家

特种行业(如旅馆业、公章刻制业、典当行、烟花爆竹销售等)因其经营业务的特殊性,受到公安等部门的严格监管。在日常执法检查、线上备案审核及金融开户等场景中,往往需要...

500

身体建模科学家谈科研发表的价值

用户11764306

某机构首席应用科学家Javier Romero的研究重点是图形学和计算机视觉,他因其发表的大量高质量论文而备受关注。自2015年以来,他在众多关注计算机视觉和成...

1700

ICLR 2026 | MRAD:不拟合直接查表,零样本工业缺陷检测新范式,16 数据集均值最优

CoovallyAIHub

MRAD 另辟蹊径——冻结 CLIP 编码器,构建双层特征-标签记忆库,推理时直接相似度检索得到异常分数,无需参数拟合。基于此衍生三个递进变体(MRAD-TF ...

1700

国产小龙虾方案实战:nanobot + 通义千问,钉钉上随时派活

CoovallyAIHub

前一篇文章我们深度拆解了 nanobot——港大开源的超轻量 AI Agent 框架,4000 行代码平替 OpenClaw,一个月冲到 32K+ Star。

4700

32K Star!港大开源Nanobot:4000行代码打造最轻量OpenClaw平替

CoovallyAIHub

一句话概括:Nanobot 是一个超轻量级的开源个人 AI 助手框架,用不到 OpenClaw 1% 的代码量,实现了核心 Agent 能力。

6900

用好DeepSeek-VL2的心法,就在上交大ACM班俞勇教授团队的这本新书里

Crossin先生

答案就在《动手学计算机视觉》这本书中!本书专注于计算机视觉技术领域,将算法原理与实践相结合,以大量示例和代码带领读者走进计算机视觉的世界,让读者认识计算机视觉的...

3910

在计算机视觉的贝叶斯深度学习中,我们需要哪些不确定性?

CreateAMind

https://proceedings.neurips.cc/paper_files/paper/2017/file/2650d6089a6d640c5e85b...

2710

CVPR 2026 | MixerCSeg:仅2.05 GFLOPs刷新四大裂缝分割基准!解耦Mamba隐式注意力,CNN+Transformer+Mamba三

CoovallyAIHub

如果你做过工业视觉部署,你知道这意味着什么——一个原本只能跑在 A100 上的模型,现在有可能塞进路边的巡检设备里。

9020

YOLO26-Pose 深度解读:端到端架构重新设计,姿态估计凭什么跨代领先?

CoovallyAIHub

姿态估计(Pose Estimation)是一种用于检测和追踪图像或视频帧中特定关键点的技术。这些关键点代表着结构性地标——人体关节、动物肢体、机械部件、甚至场...

8310

化工厂气体泄漏怎么用AI检测?30张图3D重建气体泄漏场景——美国国家实验室NeRF新研究

CoovallyAIHub

数据:DIRSIG合成LWIR HSI,128通道(7.8-13.4µm),SF6气体,231张图像

5510

OpenClaw 近 2000 个 Skills,为什么没有一个好用的视觉检测工具?

CoovallyAIHub

Skills 社区接近 2000 个技能包,从写代码到发邮件,从浏览器自动化到数据库管理,应有尽有。

18020

CVPR 2026 | 用一句话告诉 AI 分割什么——MedCLIPSeg 让医学图像分割不再需要海量标注

CoovallyAIHub

传统方法:你需要先准备几千张标注好的图像来训练模型,换个器官就得从头再来,换个医院的设备可能就不准了。

15510

Claude Code 突然变成了 66 个专家?这个 5.8k Star 的开源项目,让我重新理解了什么叫"会用 AI"

CoovallyAIHub

不是因为技术多炸裂,而是因为它让我意识到:大多数人用 Claude Code,可能只用了它 5% 的能力。

5810

181小时视频丢给GPT-5,准确率只有15%——南大联合NVIDIA等五校发布多模态终身理解数据集

CoovallyAIHub

南京大学联合NVIDIA、浙江大学、上海交通大学、东京大学发布MM-Lifelong数据集,定义"多模态终身理解"新任务。181.1小时视频横跨三个时间尺度,G...

13710

CVPR 2026 | GS-CLIP:3D几何先验+双流视觉融合,零样本工业缺陷检测新SOTA,四大3D工业数据集全面领先!

CoovallyAIHub

现有零样本3D异常检测方法将点云投影为2D图像后借助CLIP进行检测,但投影丢失了关键的几何细节,且仅依赖单一视觉模态,检测能力受限。GS-CLIP 提出"几何...

17110

AMLC 聚焦社区连接,展示AI前沿研究

用户11764306

某机构的年度内部科学大会近日举行,会议包括主题演讲、口头报告、研讨会和教程,旨在展示支撑公司众多业务的高质量科学,并在不同业务部门中研究类似挑战的科学家与工程师...

10010

City Detect获1300万美元融资用AI守护城市

用户11764306

该初创公司成立于 2021 年,现任首席执行官、联合创始人 Gavin Baum-Blake 表示,公司的成立部分源于许多城市正在努力应对“城市衰败和退化”的问...

12510

手把手部署 Vision Agents:从本地跑通到 K8s 生产上线,完整实操指南

CoovallyAIHub

上一篇《实时视觉AI智能体框架来了!Vision Agents 狂揽7K Star》的关注度很高,说明大家对实时视频 AI Agent 这个方向确实感兴趣。了解...

18610

语音AI Agent编排框架!Pipecat斩获10K+ Star,60+集成开箱即用,亚秒级对话延迟接近真人反应速度!

CoovallyAIHub

一个开源框架,用几行Python代码就能搭出能"听"、能"说"、还能"看"的实时对话AI智能体——这就是 Daily.co 团队开源的 Pipecat。

21810

Moonshine:比 Whisper 快 100 倍的端侧语音识别神器,Star 6.6K!

CoovallyAIHub

还在为语音识别的高延迟、隐私泄露、API 调用费用发愁吗?来自 Moonshine AI 的开源项目 Moonshine Voice 给出了一个令人惊艳的答案 ...

31710
领券