首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 语音助手自然对话技术突破

    自然对话转换:多模态信号融合实现流畅交互自然对话转换功能利用多模态信号——包括声学、语言和视觉线索——使语音助手能够更自然地交互,无需重复唤醒词。 新系统增加了视觉信息处理能力:搭载摄像头的设备通过终端算法处理图像数据,根据说话人的身体位置推断其是否可能正在与语音助手交互。 这种方法即使在多用户相互交流且同时与语音助手交互的场景下,也能准确识别设备指向性语音。关键技术突破智能打断处理 自然对话转换的核心能力之一是处理用户打断行为(barge-ins)。 例如当语音助手正在列举选项列表时,用户打断说"选那个",系统能识别"那个"指向被打断时正在朗读的选项。 该自然对话转换功能计划于次年正式推出,标志着人机交互技术向更自然、更智能的方向迈出重要一步。

    32310编辑于 2025-09-01
  • 来自专栏从0开始学Go

    AI 代码助手进入 对话时代

    当代码生成进入 "对话时代"2025 年 开发者 Pieter Levels 仅用 3 小时便借助 Cursor 构建出飞行模拟游戏《Fly.pieter》,这款游戏上线 9 天营收超 1.7 万美元的案例 ,揭开了 AI 代码助手的神秘面纱。 从腾讯云 AI 代码助手助力荣耀手机开发效率提升 30%,到 Cursor 在 OpenAI 等企业实现深度应用,这场由 AI 驱动的开发工具革命,正将软件开发从 "键盘敲击" 带入 "智能对话" 的全新时代 开发者只需输入自然语言指令 —— 比如 "生成用户认证模块",工具即可在 25% 的场景下通过 Tab 键精准补全代码,这种 "对话即开发" 的体验,让编码过程更接近人类的思维流。 腾讯云助手针对游戏开服场景推出的定制化模板,可自动生成服务器配置、负载均衡策略等代码;Cursor 的 Agent 模式支持终端命令执行,让开发者在对话中完成 "需求分析 - 代码编写 - 测试部署"

    40300编辑于 2025-04-14
  • 来自专栏机器学习AI算法工程

    小布助手对话短文本语义匹配

    向AI转型的程序员都关注了这个号 机器学习AI算法工程   公众号:datayx 小布助手是OPPO公司为欧加集团三品牌手机和IoT设备自研的语音助手,为用户提供了有趣、贴心、便捷的对话式服务。 意图识别是对话系统中的一个核心任务,而对话短文本语义匹配是意图识别的主流算法方案之一。 训练数据 训练数据包含输入query-pair,以及对应的真值。

    1.6K40编辑于 2022-09-06
  • 来自专栏自然语言处理

    NLP比赛-小布助手对话短文本语义匹配

    全球人工智能技术创新大赛 赛道三: 小布助手对话短文本语义匹配 赛题背景 小布助手是OPPO公司为欧加集团三品牌手机和IoT设备自研的语音助手,为用户提供了有趣、贴心、便捷的对话式服务。 意图识别是对话系统中的一个核心任务,而对话短文本语义匹配是意图识别的主流算法方案之一。

    1.3K20发布于 2021-01-14
  • 手撸AI对话助手带上思考过程

    之前文章《用LangChain驱动本地Ollama模型》讲叙了使用LangChain进行大模型对话。大模型的响应时间一般都会比较长,那么如何考虑给用户更好的体验呢? 'div');el.className='message';el.id=`msg-${msgId}`;el.innerHTML=`<divclass="message-header">AI助手

    14510编辑于 2026-03-24
  • 引入了AI大模型开发客服对话质量评估助手

    最近帮客服部门落地了“客服对话质量智能评估助手”,总算解决了他们人工评估对话质量的低效难题。 这次我们基于JBoltAI做了低侵入式开发,搭建了能自动抓取客服对话、多维度评估质量并生成整改建议的助手,把质检效率和精准度都提了上来。 ,覆盖范围有限:质检人员每天最多能抽检50条对话,全量评估根本不现实,大量问题对话可能被遗漏;而且逐句查看对话、对照评估标准打分,每条对话平均要10分钟,效率极低;评估标准不统一,结果主观性强:评估标准包含 电话客服(语音转文字后)、邮件客服等全渠道对话记录,包含客服ID、用户ID、对话时间、对话内容、问题类型等关键信息;历史对话批量导入:支持将历史客服对话记录(Excel、CSV、PDF格式)批量导入系统 五、项目总结与后续迭代方向这次开发客服对话质量评估助手的经历,让我深刻体会到“AI赋能客服质检”的核心价值——不是替代人工,而是弥补人工评估的效率低、主观性强、覆盖范围有限等短板,让质检工作更高效、更客观

    21710编辑于 2026-01-13
  • 来自专栏DIY

    和Ai-M61模组对话?手搓ChatGPT 语音助手

    超低延迟实时秒回,对话超丝滑的那种,先来看一段VCRhttps://www.bilibili.com/video/BV14193YnEVM/? 经过数周的努力,Ai-M61-32S是我们尝试的第一个模组,实现了通过语音接入 ChatGPT 实现与 Ai对话。 申请Open AI的Key(一)注册账号首先登陆Open AI官网看看试试对话的API文档:Realtime API - OpenAI API(登不上去直接放弃,等后续的豆包版本)登陆或创建邮箱,创建完成后点击账户信息

    39400编辑于 2025-03-12
  • 来自专栏CSDNToQQCode

    腾讯云AI代码助手编程挑战赛-职场人必备对话宝典

    作品简介 职场人最难的就是处理人力关系,那么本作品的目的就是对职场人在职场上关系处理上给与一定的帮助,通过简单的对话,或者给与对方的说话内容粘贴过来帮助回话即可,简单方便。 腾讯云AI代码助手在上述过程中的助力 1、理解代码 这段代码是一个Vue 3组件,它实现了一个聊天界面,允许用户与AI进行交互。 2、增加标识内容 给页面增加了显示的title,这里使用腾讯云AI代码助手完成的所有内容。 3、增加了点赞确认提示 这里使用腾讯云AI助手直接提问,黏贴对应代码完成的。

    28800编辑于 2025-01-10
  • 来自专栏机器之心

    i人小助手:Meta推出多模态对话图,帮你轻松识别社交状态

    第一 (Ego) --- 第三 (Exo) 人称对话行为 Ego-Exo 对话图 对此,他们引入了一个有向的第一 (Ego) --- 第三 (Exo) 人称对话图的概念来进行社交行为建模。 第一 (Ego) --- 第三 (Exo) 人称对话图 两个社交对的有向社交关系边属性 多模态对话注意力方法 人类在进行多人对话的社交活动时自然地利用着音视频信号的协同:我们需要视觉输入帮助识别社交对象的位置和外观 此外,一系列针对对话注意力模块和模型输入的消融实验进一步探索了模型设计细节的有效性。 具体来说,对话注意力模块中每个组件及其不同的组合都会对整体性能产生影响。 在这个示例中,摄像机佩戴者和其他两个社交对象同时与他人进行对话。在整个 3 秒的时间窗口内,一些发言者保持持续的对话,而其他人则暂停后继续。 其他可能的后续工作包括使用大生成对话群组的提要及情感分析,以及从未经预定义群组的自由多人对话中挖掘对话群组的分裂、合并等复杂群体动态。

    29210编辑于 2024-06-17
  • 来自专栏新智元

    人机对话的浪潮:语音助手、聊天机器人、机器伴侣

    2012年,国内的语音助手产品纷纷上市,然而,经过市场的检验,两年过后,大陆的语音助手类产品从火爆到冷清,纷纷下马。 究其原因,主要有两个方面: 1. 几次使用失效后,用户开始调戏他的助手了,以至于原来用于闲聊的附属功能反而成了主角。调戏一段儿,用户发现机器实在太傻,干脆弃之不用,以至于语音助手产品的总用户量巨大,而留存量很小。 2. 小冰与语音助手有什么不同? 1. 我猜测这一轮会进一步地培养用户,摸清人机对话的沟沟坎坎,把技术提升到一个新的高度,但因为仍然令广大用户失望,而再次被抛弃,成为新产品的铺路石。 那么,未来的人机对话产品会是什么样儿呢? 以快速结束人机对话为目标(语音助手主要采用这种模式) 这又包括两种,一种是命令执行,一种是信息查询。

    2.5K80发布于 2018-03-13
  • 来自专栏IT技术分享社区

    DeepSeek系列:掌握这九个DeepSeek对话技巧,解锁AI高效能助手

    在人工智能飞速发展的今天,DeepSeek凭借其强大的AI能力,已经成为许多人提升工作效率和解决问题的得力助手。然而,要想真正发挥DeepSeek的潜力,关键在于掌握高效的提问技巧。 以下是九个实用的DeepSeek对话技巧,帮助你成为生活中的AI高手。1. 精准聚焦,直达核心DeepSeek的优势在于能够精准理解用户需求,但前提是你的问题必须明确。 通过精准提问、结构化描述、专业术语运用、分步提问等技巧,你可以让DeepSeek成为提高生产力、节省时间、增加收入的得力助手

    53420编辑于 2025-03-17
  • 来自专栏深度学习与python

    ChatGPT 正式进入车载系统:奔驰首测 AI 语音助手,可进行复杂对话

    梅赛德斯 - 奔驰表示,从 6 月 16 日开始,在美 90 万辆配备 MBUX 信息娱乐系统的车辆都可参与测试,使用 ChatGPT 驱动的语音助手。 注册完成后,车主便可以通过车载语音助手访问 ChatGPT。 对于此次合作,微软指出,车载 ChatGPT 能支持更动态的对话——不仅可以理解车主的语音命令,还可以进行交互式对话对话范围可以涵盖地点信息、菜谱、甚至是一些更加复杂的问题,进而让驾驶员的眼睛更专注于路况 与普通的语音助手不同,车载 ChatGPT 可以处理完整的对话,例如追问,并且能保持对前后文的理解。驾驶员可以提出复杂的问题或进行多轮对话,从语音助手那里收到详细的回复。

    46930编辑于 2023-08-09
  • 来自专栏GPUS开发者

    在Jetson上玩转大模型Day12:NanoLLM开发平台(2):语音对话助手

    现在使用NanoLLM开发环境重新搭建Llamaspeak应用,就变得非常简单,而且在旧版只支持语言对话的功能之上,还增加了对多模态大语言模型的支持,这样的使用性就变得非常高了。 model meta-llama/Meta-Llama-3-8B-Instruct --asr=riva --tts=piper 这里使用Meta-Llama-3-8B-Instruct模型,执行纯语言的对话

    67910编辑于 2024-11-19
  • 来自专栏新智元

    谷歌发布世界最大任务型对话数据集SGD,让虚拟助手更智能

    另外,各研究者也可将其用于对话技术创新。 这在一定程度上是由于缺乏合适的数据集,这些数据集无法与虚拟助手所面对的规模和复杂性相匹配。 SGD数据集由人类和虚拟助手之间超过18000条的带注释的任务型对话组成。这些对话涉及17个领域。 此方法不需要为助手设定master schema。相反,每个服务或API都会提供其模式功能及其相关属性的自然语言描述。然后,这些描述会用于学习模式的分布式语义表示,语义表示则会作为对话系统的附加输入。 “我们认为该数据集将会成为建立大规模对话模型的良好基准,” Rastogi和Khaitan称。“我们期待研究界将其用于对话技术的发展创新。”

    1.2K30发布于 2019-11-01
  • CodeBuddy Craft:AI重塑智能办公——对话式开发打造微信办公助手终极形态

    作为国内首个支持微软代码平台协议(MCP)的AI编程助手,它凭借革命性的Craft智能体,正在创造一种全新的可能:通过自然语言对话生成企业级应用,让每个普通职场人都能拥有专属的「数字分身」。 本文将全景展现如何用CodeBuddy Craft在18小时内开发出微信智能办公助手,重构打卡、会议、总结、任务管理四大核心场景的工作流。 二、破界:Craft智能体的「对话式创造」‌ ‌‌ 需求对话是从混沌到具象的实现过程,而Craft表现出了堪称大师级别的理解能力,这次我们彻底不考虑代码,一行代码也不用自己动手写,将开发的细节工作抛之脑后 在与Craft的开发对话框输入战略指令: 请帮我实现小程序,希望能够开发出一个微信智能体或者说虚拟客服,我能登陆我自己的微信账号与其对话,它能提供上述三种提醒功能,并像微信聊天一样将提醒消息在聊天对话框发送给我 更令人惊喜的是,通过分析历史数据,助手会在每周三下午自动提醒:“检测到您本周已加班9小时,建议今日准点下班。” ‌2.

    53520编辑于 2025-05-14
  • 对话即服务:Spring Boot整合MCP让你的CRUD系统秒变AI助手

    想象一下这样的场景:用户无需钻研复杂的API文档或者在繁琐的表单间来回切换,只需通过自然语言直接与系统对话——"帮我查找所有2023年出版的图书"、"创建一个新用户叫张三,邮箱是zhangsan@example.com ChatClient chatClient(ChatClient.Builder builder) { return builder .defaultSystem("你是一个图书管理助手 ChatClient chatClient(ChatClient.Builder builder) { return builder .defaultSystem("你是一个图书管理助手 小结 通过Spring Boot与MCP的整合,我们轻松实现了传统CRUD系统到智能AI助手的转变。MCP作为AI与服务之间的桥梁,极大简化了集成工作。 未来随着MCP生态发展,"对话即服务"将可能成为应用的开发范式,让复杂系统变得更加易用。

    6K92编辑于 2025-03-21
  • 来自专栏AIOT

    在Jetson上玩转大模型Day12:NanoLLM开发平台(2):语音对话助手

    前面已经简单介绍过在Jetson AI Lab所提供的NanoLLM开发平台上的API基本内容,使用这些API可以非常轻松地开发并整合比较复杂的应用,现在就用一个比较具有代表性的Llamaspeak对话机器人项目 现在使用NanoLLM开发环境重新搭建Llamaspeak应用,就变得非常简单,而且在旧版只支持语言对话的功能之上,还增加了对多模态大语言模型的支持,这样的使用性就变得非常高了。 model meta-llama/Meta-Llama-3-8B-Instruct --asr=riva --tts=piper这里使用Meta-Llama-3-8B-Instruct模型,执行纯语言的对话

    68310编辑于 2024-11-18
  • 来自专栏DeepHub IMBA

    从零构建智能对话助手:LangGraph + ReAct 实现具备记忆功能的 AI 智能体

    记忆循环系统通过 MessagesState 携带完整的对话历史,实现了多跳推理能力。这种循环记忆机制是智能决策的技术基础。 对于实际的多轮对话应用,记忆功能是必不可少的技术要求,它使智能体能够维持上下文连续性,回溯历史信息,并构建连贯的对话体验。 LangGraph 通过检查点机制提供了内置的记忆支持。 智能体核心概念的深入理解及其在复杂问题解决中的优势;基于 LangGraph 框架的智能体架构设计,实现了推理与工具使用的有机结合;推理-行动循环机制的技术实现,支持多步骤问题解决流程;记忆系统的集成,实现了多轮对话中的上下文感知能力

    1.4K10编辑于 2025-08-20
  • 来自专栏程序那些事儿

    Chat4GPT:一款本地部署的交互式对话的智能助手

    Chat4GPT 是一个基于 GPT4All 生态系统的强大的交互式对话模型。它运用了最新的自然语言处理技术,为用户提供了一个能够进行自然、流畅对话的智能助手。 Chat4GPT 的核心目标之一是提供最强大的本地助手模型,使其能够在您的桌面上工作。Nomic AI 正在积极努力改进模型的性能和质量,并不断进行优化和创新。 通过不断提升模型的性能和质量,Chat4GPT 能够更好地满足用户在对话交互中的需求。 他们持续进行研究和创新,以提供更强大、更可靠的本地助手模型。 多操作系统支持:GPT4All 支持多个操作系统,包括 Windows、Linux 和 macOS。 Chat4GPT 的应用场景 个人助手:作为一款智能助手,Chat4GPT 可以帮助用户回答问题、提供实用建议和指导。

    78520编辑于 2023-12-30
  • 来自专栏跟着AI学

    智能压缩,高效对话:基于 Skills 的任务感知压缩让你的 AI 助手更聪明

    随着AI编程助手(如Cursor、ClaudeCode)的普及,开发者们享受着前所未有的效率提升。那你是否也遇到过这样的困扰:多轮对话后上下文过长,token飙升,响应变慢,成本激增? Skills是一个强大的AI助手扩展框架,允许开发者通过声明式配置为AI助手添加专业化能力。每个Skill都是一个独立的功能模块,可以在对话中按需调用,让AI助手变得更加智能和高效。 AI编程助手重度用户:每天与AI进行数十轮对话成本敏感用户:希望降低API调用成本效率追求者:希望获得更快的AI响应速度Agent开发者:构建需要长期记忆的AIAgent如何开始? 你可以轻松地将其集成到你的环境中:安装步骤将Skill添加到你的Skills目录展开代码语言:BashAI代码解释cp-rtask-aware-compression~/.cursor/skills/在对话中调用当对话上下文过长时 让每一次对话都更有价值。项目地址:task-aware-compression

    25710编辑于 2026-01-26
领券