首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • AI Glasses 实践应用开发指南】

    AI Glasses 实践应用开发指南 监听眼镜端AI事件 通过CXR-M SDK的setAiEventListener方法注册监听器,可捕获眼镜端AI场景的按键事件和状态变化。 private val aiEventListener = object : AiEventListener { override fun onAiKeyDown() { // 长按AI } override fun onAiKeyUp() { // 按键释放处理 } override fun onAiExit() { // AI 使用sendTTSContent播放翻译结果 智能导览场景 takePhoto获取当前视野图像 图像上传至物体识别服务 通过TTS返回识别结果和背景介绍 onAiExit时释放相机资源 代码结构建议 ai-glasses-app 在Android平台上需要正确处理onPause()/onResume()事件 示例:相机预览应在Activity进入后台时及时释放资源 需考虑异常场景:如相机被其他应用占用时的错误处理 ASR

    27210编辑于 2025-12-18
  • AI Glasses带你走进动物世界

    最近楼主手头上搞了个AIGlasses产品,萌生一个创意就是通过AI眼镜识别动物昆虫。 技术思路:AI眼镜拍照-->智能体识别匹配-->匹配信息AR投射用户端进入智能体,通过指定的指令,如“识别动物”唤起AI扫码当前眼镜前的动物影像;智能体捕获到眼镜端的拍照媒体,匹配对应的动物信息,并按格式进行输出 但随着AIGlasses等AI产品的相继推出还有云端智能体的更新迭代,端云结合的玩法和实现场景肯定不仅仅局限于此。

    11000编辑于 2025-12-01
  • AI Glasses走进小吃街,实现美食百科

    这时,我脑海中浮现出最近接触的AI Glasses产品。如果戴上眼镜,看到小吃时,眼前直接浮现它的“美食名片”,那该多酷? 于是,一个面向“吃货”的技术方案应运而生:AI眼镜 + 图像识别 + 美食百科 + AR投射。 云侧识别:云端AI模型对图像进行精确分类,匹配对应的小吃品种。百科匹配:根据识别结果,从美食知识库中提取名称、热量、成分、辣度等信息。AR投射:将信息以悬浮窗形式投射到用户视野中,不影响正常观看。 四、技术亮点与未来想象这套方案围绕 “端云协同+智能感知+场景化呈现”,让AI眼镜成为吃货的“第二层味蕾”:端云协同:端侧快速采集与预处理,云侧精准识别,响应时间控制在500ms内,实现“即看即知”。 技术改变生活,AI让逛吃不再盲目。也许明年此时,我们就能戴着这样的眼镜,在夜市里悠然自得,一眼看尽人间烟火里的美食密码。

    9210编辑于 2026-02-27
  • 来自专栏应用实践

    基于 Rokid AI Glasses 的春节红包助手:从零到一的技术实践

    然而,消息刷屏导致的红包漏看、跨应用的红包统计不便、金额记录混乱等问题,依然是许多用户的痛点 Rokid CXR-M SDK 为开发者提供了连接 Android 手机与 Rokid AI Glasses 整个方案严格遵循 SDK 接口规范,在设备连接、消息监听、数据解析、语音交互等环节进行应用开发实践,旨在为开发者提供一个可复现、可落地、贴近生活的技术范本,展示Rokid AR 生态在日常场景中的应用潜力 记得去年春节,家族群里红包满天飞,但我总有几个痛点:消息容易漏看——群里消息刷得快,红包往往被淹没金额记不清——发了多少、收了多少,最后算账要翻半天记录跨应用管理麻烦——微信、支付宝都有红包,统计起来很费劲作为一个技术人 大概率能找到答案CXR-M/CXR-S 分离设计——移动端和眼镜端各干各的,逻辑清晰整体技术栈大概是这样的:  图1:系统架构图 客户端、服务层、数据层的关系架构说明: 层级职责客户端层Rokid Glasses CXR-M/CXR-S SDK 处理跨设备通信,AccessibilityService 监听红包数据层Room Database 存储红包记录,SharedPreferences 存储配置SDK 与Glasses

    13310编辑于 2026-03-03
  • 来自专栏云云众生s

    构建多模态AI应用7大工具

    译自 Top 7 Tools for Building Multimodal AI Applications,作者 Kimberley Mok。 其他潜在用途包括图像到文本和文本到图像搜索、视觉问答 (VQA)、图像分割和标记,以及创建特定领域 AI 系统和 MLLM 代理。 7. Claude 3 这个由 Anthropic (https://www.anthropic.com/) 开发的视觉语言模型有三个迭代版本:Haiku、Sonnet 和 Opus. Claude 3 (https://claude.ai/) 具有强大的回忆能力,可以处理包含超过 100 万个标记的输入序列。 结论 现在有大量的多模态 AI 工具可用,大多数大型科技公司现在都提供某种 MLLM。

    83310编辑于 2024-12-20
  • 来自专栏Debug日志

    【征文计划】AR健身教练:形随心动 - 基于Rokid CXR-M SDK的实践落地

    Rokid CXR-M SDK介绍 CXR-M SDK 是面向移动端的开发工具包,主要用于构建手机端与 Rokid Glasses 的控制和协同应用。 整体架构 "形随心动"采用分层架构设计,确保系统稳定性和可扩展性: 应用层(Android App) → CXR-M SDK → Rokid Glasses(YodaOS) → 硬件传感器 应用层:提供用户界面 心率等数据 "形随心动"应用的整体技术架构: 架构说明: 应用层:包含用户界面、健身计划管理、社交功能等业务逻辑 CXR-M SDK:Rokid提供的核心SDK,负责与硬件通信和功能调用 Rokid Glasses 电池消耗问题 挑战:AR应用长时间运行导致Rokid Glasses电池消耗过快。 通过"形随心动"的实践,我们验证了Rokid Glasses与CXR-M SDK在AI+AR场景中的巨大潜力,也为Rokid开发者社区贡献了一个成功的应用案例。

    39110编辑于 2025-10-13
  • 来自专栏应用实践

    【征文计划】AR健身教练:形随心动 - 基于Rokid CXR-M SDK的实践落地

    Rokid CXR-M SDK介绍CXR-M SDK 是面向移动端的开发工具包,主要用于构建手机端与 Rokid Glasses 的控制和协同应用。 整体架构"形随心动"采用分层架构设计,确保系统稳定性和可扩展性:应用层(Android App) → CXR-M SDK → Rokid Glasses(YodaOS) → 硬件传感器应用层:提供用户界面 "形随心动"应用的整体技术架构:架构说明:应用层:包含用户界面、健身计划管理、社交功能等业务逻辑CXR-M SDK:Rokid提供的核心SDK,负责与硬件通信和功能调用Rokid Glasses:硬件平台 电池消耗问题挑战:AR应用长时间运行导致Rokid Glasses电池消耗过快。 通过"形随心动"的实践,我们验证了Rokid Glasses与CXR-M SDK在AI+AR场景中的巨大潜力,也为Rokid开发者社区贡献了一个成功的应用案例。

    33310编辑于 2025-10-11
  • 来自专栏机器之心

    7 Papers & Radios | Transformer自动debug;AI合成舞蹈落地应用

    上述 AI 生成代码示例在 APPS 数据集中被视为「面试级别」的问题。 ? AI 的解答代码。 推荐:程序员终究卷到了自家? 尽管业界也曾出现过多项红极一时的研究成果,如 AI Choreographer 和 DanceNet3D,然而这些方案并未落地于实际商业生产应用。 历经两年多的潜心研发,网易互娱 AI LAB 的研发团队提出了符合实际生产环境应用要求的 AI 舞蹈动画合成方案 ChoreoMaster。 语音转换在电影配音、角色模仿以及复刻人物音色等方面都有重要的应用。 (from Mohamed-Slim Alouini) 7.

    79550发布于 2021-06-08
  • 来自专栏DotNet NB && CloudNative

    AI应用实战课学习总结(7)聚类算法分析实战

    最近入坑黄佳老师的《AI应用实战课》,记录下我的学习之旅,也算是总结回顾。 今天是我们的第7站,一起了解下聚类算法基本概念 以及 通过聚类算法辅助用户画像的案例。 小结 本文介绍了机器学习中的聚类场景问题,常用的聚类算法 以及 分类和聚类的简单对比,最后再次通过电商订单数据做用户画像的案例做了一次聚类实战,相信对你理解聚类应用应该有所帮助。

    52510编辑于 2025-03-13
  • 分析2025年智能眼镜最新技术与动态

    3.2 AI能力:从被动响应到主动感知 现代智能眼镜的AI能力已经远超我们的想象。以Meta Ray-Ban为例: 实际应用场景: 实时学习助手:看到不认识的植物,问一句"这是什么花?" 4.1 产品参数大PK 产品特性 Meta Ray-Ban 小米AI眼镜 Rokid Glasses Apple智能眼镜 星纪魅族MYVU 价格 $299起 ¥1,999起($280) ¥2,499 未发布 内容生态:AR应用AI服务、娱乐内容快速增长 服务生态:云计算、边缘计算、AI模型服务成熟 总结:智能眼镜的黄金时代已来 2025年确实是智能眼镜发展史上的重要转折点。 :光学器件、AI芯片、传感器厂商 品牌厂商:具有设计能力和渠道优势的消费电子厂商 应用开发:AR应用AI服务、内容创作领域 基础设施:5G网络、边缘计算、云服务提供商 虽然当前的智能眼镜还不能完全替代智能手机 本文基于2025年7月最新市场数据和技术动态分析,随着技术快速发展,部分信息可能需要持续更新。欢迎关注后续的技术发展报告。

    65111编辑于 2025-07-11
  • 来自专栏悦思悦读

    AI 入行那些事儿(7)深度神经网络的发展及其应用

    2021 巨献 —— 系列文章《AI 入行那些事儿》,为您讲述: 人工智能的基础原理、发展历程、当前应用 成为 AI 技术人员所需的入门技能和学习途径 以及求职、面试的全过程 几度沉浮的神经网络 神经网络模型的发展几经沉浮 直到2006年,加拿大多伦多大学的辛顿(Hinton)教授发表了一篇关于深度神经网络的论文,把当时硬件的发展和神经网络结合起来,将GPU应用到深度学习的训练中。 深度学习的应用 说到深度神经网络,大家想必都听说过颇负盛名的AlphaGo。它是2016年上线的智能机器人,当年挑战了韩国的九段棋手李世石,并以4:1的战绩大获全胜。 离我们最近的一个深度学习应用是智能音箱。 ? 现在智能音箱的种类非常多,不管是哪种,都可以实现通过语音控制执行各种操作,这涉及到语音识别功能。 现阶段,从工业实践的角度而言,深度学习主要应用于语音处理、图像处理、自然语言处理和知识图谱等领域。

    1.1K10发布于 2021-03-04
  • 来自专栏架构师专栏

    2025年智能眼镜最新技术与动态分析

    Rokid Glasses采用的”一拖二”光学设计,通过单光机驱动双目显示,在保证AR显示效果的同时大幅降低了成本。 3.2 AI能力:从被动响应到主动感知现代智能眼镜的AI能力已经远超我们的想象。以Meta Ray-Ban为例:实际应用场景: - 实时学习助手:看到不认识的植物,问一句”这是什么花? 软件生态:操作系统、应用商店、开发者工具链完善 内容生态:AR应用AI服务、娱乐内容快速增长 服务生态:云计算、边缘计算、AI模型服务成熟 总结:智能眼镜的黄金时代已来2025年确实是智能眼镜发展史上的重要转折点 生态完善度:从硬件到软件,从内容到服务,产业链日趋完善投资机会: - 技术供应商:光学器件、AI芯片、传感器厂商 - 品牌厂商:具有设计能力和渠道优势的消费电子厂商- 应用开发:AR应用AI服务 本文基于2025年7月最新市场数据和技术动态分析,随着技术快速发展,部分信息可能需要持续更新。欢迎关注后续的技术发展报告。

    89910编辑于 2025-07-07
  • 来自专栏高德开放平台技术

    高德地图xRokid,联合打造首个智能眼镜导航行业标杆

    2025年5月16日,高德地图与Rokid宣布达成合作,将共同推出基于全场景智能眼镜Rokid Glasses的全球首个导航智能体(NaviAgent)应用,标志着高德Planner-Executor架构即将开启跨终端合作部署 近两年来,积极投入了人工智能等前沿领域,并应用Planner-Executor创新技术理念和架构,推出了全球首个集“感知、规划、执行、表达”的全链路AI导航智能体,为高德地图APP用户提供独树一帜的导航服务体验 AI智能导航,引领出行新体验融合了高德AI导航智能体的Rokid Glasses,可通过“语音+视觉+环境感知”三维交互模式,并可轻松切换步行、骑行、驾车三种导航模式,且在导航过程中也能实现模式的无缝切换 除了导航服务外,未来还计划将生活服务、文旅景区等丰富内容融入Rokid Glasses中:例如可通过智能眼镜获取周边商家优惠信息、生活缴费等功能;在文旅景区,智能眼镜可为游客提供景区导览、历史文化讲解等服务 高德地图CEO郭宁认为,导航智能体作为高德AI战略的最新实践,标志着出行服务从软件功能驱动,向空间智能驱动的结构性跃迁。

    40710编辑于 2025-05-19
  • 来自专栏量化投资与机器学习

    【独家】人工智能『AI应用算法交易,7个必踩的坑!

    对于大多数ML在CV、NLP、推荐系统中的应用,甚至一些时间序列分析和信号处理中都是如此……但是对于金融时间序列就不是这样的! 这些分割代表了一种情况,当我们每N天重新训练一个网络(例如N = 21),验证未来3-7天的性能,如果它满足运行在样本交易周期之外。 2、训练和val测试21 / 30天和7 / 14天(优化)。 3、用简单的多空股票策略进行回测(周调仓)。 它们几乎每周都超过基准。你能相信这些回测结果的真实性吗? 结论 机器学习应用量化金融是不同的,也是困难的。我们确信在这个过程中仍然遗漏了很多,我们使用的资源并不能涵盖所有的问题,但是我们可以看到,仅仅使用Keras神经网络是远远不够的。 这篇文章虽然告诉大家ML可能在量化金融领域并不是那么一帆风顺,但实际上它与机器学习应用的其他领域并没有太大的不同。无论如何,你要全面的研究整个市场,正确的建模。

    1.2K10发布于 2019-02-26
  • 来自专栏XAI

    百度人脸识别API Java调用

    1.官网文档必须看 http://ai.baidu.com/docs 2.在管理中心创建应用及查看相关参数 AppID APIKey SecretKey都需要保存起来 3.搬砖测试 项目需要的lib包, final String TOKEN = "为了测试,将生成的key先存一下"; } 4.获取AccessToken 官网文档说明http://ai.baidu.com/docs#Beginner-Auth +WpfDW0PyUt7EP\/Uyn74r31lj3d4kVr4xkbkSk","scope":"public vis-faceverify_faceverify vis-faceattribute_faceattribute NoSuchAlgorithmException ex) { throw new RuntimeException(ex); } } } 6.检测人脸美丑及年龄 http://ai.baidu.com EntityUtils.toString(response.getEntity())); } catch (Exception e) { e.printStackTrace(); } } } 7.

    4.7K110发布于 2018-02-08
  • 来自专栏云攻略专区

    【元宇宙7AI跳绳】这个APP轻应用是如何实现的?有哪些应用场景?

    有上升空间,谢谢 #一、什么是AI跳绳轻应用? “AI跳绳”是近期某钉应用新发布运动健康较火热的轻量应用AI跳绳互动娱乐应用场景: 运动健康小应用场景:各种姿势模型,例如跳绳、仰卧起作、AI开合跳等等(只要AI模版训练好,各种形体都支持) 实时人体轮廓检测、AR动漫IP人动作捕捉合成等技术 未来如"形体框 "AI识别技术成熟,民用AI和jun用AI辅助系统将应用更广泛,一旦是定制形体锁定识别,到触发后面执行程序等,甚至“形体姿态”预判等5.0超人工智能应用大场景; image.png image.png video/BV1Gv411q7JB/ 4)火山引擎产品:https://www.volcengine.com/product/gesture-body-detect? 5)极视角动作识别:https://www.extremevision.com.cn/products/123.html 6)python实现跳绳计数:跳绳AI计数_哔哩哔哩_bilibili 7AI

    6K22编辑于 2022-03-11
  • 来自专栏AI小程序

    AI人脸应用

    这款颜值检测小程序使用了腾讯开放人脸识别API,本项目适合刚入门的同学练手,熟悉整个框架,整体实现如下:

    1.3K00发布于 2019-01-06
  • Rokid vs Nreal 虚拟拍照开发实现

    Rokid vs Nreal 虚拟拍照开发实现 本文将对 Rokid Glasses 与 Nreal Glasses 在虚拟拍照应用开发中的实现方案进行对比与总结,涵盖硬件配置、开发环境、FOV 场景搭建 建议为关键操作(如AI拍照)添加重试机制,并设置超时阈值(如10秒)。 :跨平台兼容性强,更适合企业/云端/PC 应用,但 FOV 较小。 Nreal Glasses:FOV 更大,沉浸感好,更适合消费级娱乐应用,但依赖手机生态。 开发建议: 抽象 SDK 接口,保证业务逻辑与硬件解耦。 在 虚拟拍照 应用中重点优化 投影畸变、性能稳定性、异常校准。

    24610编辑于 2025-12-17
  • AI 应用感想

    龙虾热潮退去,最终会剩下文字相关的应用——编程、写文章、论文等等。一、大模型本质是文字模型不管形态如何变化,大模型的输出仍然以文字为主。 最终沉淀下来的应用,一定是那些将文字能力发挥到极致的场景。二、多代理提高可用性,但仍未达到可信的专家水平多代理架构让任务可以并行、分工、协作,显著提升了复杂任务的完成率。 这意味着所有AI输出都必须经过经验丰富的人员验证,以避免疏漏和安全问题。这是当前AI应用落地的最大瓶颈——不是技术不够强,而是信任成本太高。 未来可能出现”AI审计AI”的模式:一个代理负责输出,另一个专门负责对抗性验证,降低人工成本的同时保留人类兜底。四、记忆之后,还有知识整理与理解偏差记忆问题的解决只是第一步。 五、下一个高价值方向:代理自组织与AI团队导师人类组织中有项目管理和项目经理,AI代理体系同样需要自组织能力。

    8700编辑于 2026-03-30
  • 来自专栏软件安装

    AI应用开发

    AI应用开发是将人工智能技术与实际业务场景结合,构建具有智能决策、自动学习或感知能力的应用系统。 它融合了传统软件开发与机器学习、深度学习等AI技术,以下是其核心要素和流程: 一、AI应用的核心技术栈 基础框架 机器学习:Scikit-learn、XGBoost、LightGBM 深度学习:TensorFlow Platform、Azure ML 二、AI应用开发的典型流程 问题定义与数据准备 明确AI要解决的核心问题(如分类、预测、生成等) 数据采集(爬虫、API、传感器等)、清洗(去噪、补全)、标注 (通过API接口或SDK) 构建监控系统(跟踪模型精度衰减、数据漂移) 迭代优化 基于用户反馈和新数据持续更新模型 优化计算效率(边缘部署或云端算力调度) 三、示例:简单的文本分类AI应用 以下是一个基于预训练模型的文本分类应用 ) 可解释性:部分场景(如医疗、金融)需要模型决策可解释 五、常见AI应用场景 智能客服(NLP对话系统) 图像识别(安防监控、质检) 推荐系统(电商、内容平台) 预测分析(金融风控、需求预测) AI应用开发的核心是

    51210编辑于 2025-11-12
领券