首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 语音助手自然对话技术突破

    自然对话转换:多模态信号融合实现流畅交互自然对话转换功能利用多模态信号——包括声学、语言和视觉线索——使语音助手能够更自然地交互,无需重复唤醒词。 新系统增加了视觉信息处理能力:搭载摄像头的设备通过终端算法处理图像数据,根据说话人的身体位置推断其是否可能正在与语音助手交互。 这种方法即使在多用户相互交流且同时与语音助手交互的场景下,也能准确识别设备指向性语音。关键技术突破智能打断处理 自然对话转换的核心能力之一是处理用户打断行为(barge-ins)。 例如当语音助手正在列举选项列表时,用户打断说"选那个",系统能识别"那个"指向被打断时正在朗读的选项。 该自然对话转换功能计划于次年正式推出,标志着人机交互技术向更自然、更智能的方向迈出重要一步。

    33210编辑于 2025-09-01
  • 来自专栏从0开始学Go

    AI 代码助手进入 对话时代

    当代码生成进入 "对话时代"2025 年 开发者 Pieter Levels 仅用 3 小时便借助 Cursor 构建出飞行模拟游戏《Fly.pieter》,这款游戏上线 9 天营收超 1.7 万美元的案例 从腾讯云 AI 代码助手助力荣耀手机开发效率提升 30%,到 Cursor 在 OpenAI 等企业实现深度应用,这场由 AI 驱动的开发工具革命,正将软件开发从 "键盘敲击" 带入 "智能对话" 的全新时代 2024 年 9 月上线的混元 Turbo 模型,在保持性能对标 GPT-4o 的同时,将输入输出成本降低 50%,这种 "打对折还提速" 的能力,让企业级 AI 能力不再是少数人的特权。 这种专业化趋势,让 AI 代码助手在复杂场景中的表现愈发精准 —— 某医疗软件公司使用专项训练的模型,代码错误率从 12% 降至 4%,原本需要 3 天的合规性检查,现在 AI 可在半小时内完成。 腾讯云助手针对游戏开服场景推出的定制化模板,可自动生成服务器配置、负载均衡策略等代码;Cursor 的 Agent 模式支持终端命令执行,让开发者在对话中完成 "需求分析 - 代码编写 - 测试部署"

    43100编辑于 2025-04-14
  • 来自专栏机器学习AI算法工程

    小布助手对话短文本语义匹配

    向AI转型的程序员都关注了这个号 机器学习AI算法工程   公众号:datayx 小布助手是OPPO公司为欧加集团三品牌手机和IoT设备自研的语音助手,为用户提供了有趣、贴心、便捷的对话式服务。 意图识别是对话系统中的一个核心任务,而对话短文本语义匹配是意图识别的主流算法方案之一。 训练数据 训练数据包含输入query-pair,以及对应的真值。

    1.6K40编辑于 2022-09-06
  • 来自专栏程序那些事儿

    Chat4GPT:一款本地部署的交互式对话的智能助手

    Chat4GPT 是一个基于 GPT4All 生态系统的强大的交互式对话模型。它运用了最新的自然语言处理技术,为用户提供了一个能够进行自然、流畅对话的智能助手。 Chat4GPT 的核心目标之一是提供最强大的本地助手模型,使其能够在您的桌面上工作。Nomic AI 正在积极努力改进模型的性能和质量,并不断进行优化和创新。 Chat4GPT 的功能 自然流畅的对话:Chat4GPT 通过深度学习模型训练,具备了解和生成自然语言的能力。 持续的改进和优化:Nomic AI 和 GPT4All 团队致力于不断改进 Chat4GPT 的性能和质量。他们持续进行研究和创新,以提供更强大、更可靠的本地助手模型。 Chat4GPT 的应用场景 个人助手:作为一款智能助手,Chat4GPT 可以帮助用户回答问题、提供实用建议和指导。

    80020编辑于 2023-12-30
  • 来自专栏自然语言处理

    NLP比赛-小布助手对话短文本语义匹配

    全球人工智能技术创新大赛 赛道三: 小布助手对话短文本语义匹配 赛题背景 小布助手是OPPO公司为欧加集团三品牌手机和IoT设备自研的语音助手,为用户提供了有趣、贴心、便捷的对话式服务。 意图识别是对话系统中的一个核心任务,而对话短文本语义匹配是意图识别的主流算法方案之一。

    1.3K20发布于 2021-01-14
  • 手撸AI对话助手带上思考过程

    之前文章《用LangChain驱动本地Ollama模型》讲叙了使用LangChain进行大模型对话。大模型的响应时间一般都会比较长,那么如何考虑给用户更好的体验呢? #0a0a0f;--surface:#12121a;--border:#2a2a3a;--think-bg:#13130a;--think-border:#3a3a1a;--think-text:#d4a843 'div');el.className='message';el.id=`msg-${msgId}`;el.innerHTML=`<divclass="message-header">AI助手

    16410编辑于 2026-03-24
  • 引入了AI大模型开发客服对话质量评估助手

    最近帮客服部门落地了“客服对话质量智能评估助手”,总算解决了他们人工评估对话质量的低效难题。 这次我们基于JBoltAI做了低侵入式开发,搭建了能自动抓取客服对话、多维度评估质量并生成整改建议的助手,把质检效率和精准度都提了上来。 一、项目背景:传统客服对话质检的4大核心痛点我们公司客服团队有50+人,每天要处理上千条用户对话(覆盖文字、语音、在线聊天等渠道),传统的对话质量评估完全依赖人工质检,痛点突出到客服主管多次申请优化:评估效率极低 4. 五、项目总结与后续迭代方向这次开发客服对话质量评估助手的经历,让我深刻体会到“AI赋能客服质检”的核心价值——不是替代人工,而是弥补人工评估的效率低、主观性强、覆盖范围有限等短板,让质检工作更高效、更客观

    28210编辑于 2026-01-13
  • 来自专栏DIY

    和Ai-M61模组对话?手搓ChatGPT 语音助手

    超低延迟实时秒回,对话超丝滑的那种,先来看一段VCRhttps://www.bilibili.com/video/BV14193YnEVM/? 经过数周的努力,Ai-M61-32S是我们尝试的第一个模组,实现了通过语音接入 ChatGPT 实现与 Ai对话。 申请Open AI的Key(一)注册账号首先登陆Open AI官网看看试试对话的API文档:Realtime API - OpenAI API(登不上去直接放弃,等后续的豆包版本)登陆或创建邮箱,创建完成后点击账户信息 (二)收费标准这里固件接入的模型是gpt-4o-mini-realtime-preview。有一份token的收费标准。

    40200编辑于 2025-03-12
  • 来自专栏Qt项目实战

    Qt开源作品4-网络调试助手

    一、前言 网络调试助手和串口调试助手是一对的,用Qt开发项目与硬件通信绝大部分都是要么串口通信(RS232 RS485 Modbus等),要么就是网络通信(TCP UDP HTTP等),所以一旦涉及到这两方面 ,多多少少肯定离不开对应的调试助手协助进行程序的调试,尤其是硬件工程师,更加需要第三方的独立的调试工具来验证硬件工作是否正常,这可以大大避免扯皮的事情发生,既然第三方的工具测试下来没有问题,收发数据都正常的话

    2.2K30发布于 2020-04-28
  • 来自专栏CSDNToQQCode

    腾讯云AI代码助手编程挑战赛-职场人必备对话宝典

    作品简介 职场人最难的就是处理人力关系,那么本作品的目的就是对职场人在职场上关系处理上给与一定的帮助,通过简单的对话,或者给与对方的说话内容粘贴过来帮助回话即可,简单方便。 腾讯云AI代码助手在上述过程中的助力 1、理解代码 这段代码是一个Vue 3组件,它实现了一个聊天界面,允许用户与AI进行交互。 2、增加标识内容 给页面增加了显示的title,这里使用腾讯云AI代码助手完成的所有内容。 3、增加了点赞确认提示 这里使用腾讯云AI助手直接提问,黏贴对应代码完成的。 效果如图: 使用说明 1、解压并配置node.js环境变量 2、使用npm i命令初始化项目 3、使用npm run dev启动项目 4、访问http://localhost:3005/进行提问即可。

    29600编辑于 2025-01-10
  • 来自专栏机器之心

    i人小助手:Meta推出多模态对话图,帮你轻松识别社交状态

    她的主要研究方向聚焦于第一人称视角下的人类行为分析及意图理解,曾参与 Ego4D 项目,并在 CVPR,ECCV,ACL 等顶级会议上发表多篇论文。 第一 (Ego) --- 第三 (Exo) 人称对话行为 Ego-Exo 对话图 对此,他们引入了一个有向的第一 (Ego) --- 第三 (Exo) 人称对话图的概念来进行社交行为建模。 第一 (Ego) --- 第三 (Exo) 人称对话图 两个社交对的有向社交关系边属性 多模态对话注意力方法 人类在进行多人对话的社交活动时自然地利用着音视频信号的协同:我们需要视觉输入帮助识别社交对象的位置和外观 在这个示例中,摄像机佩戴者和其他两个社交对象同时与他人进行对话。在整个 3 秒的时间窗口内,一些发言者保持持续的对话,而其他人则暂停后继续。 其他可能的后续工作包括使用大生成对话群组的提要及情感分析,以及从未经预定义群组的自由多人对话中挖掘对话群组的分裂、合并等复杂群体动态。

    30010编辑于 2024-06-17
  • 来自专栏新智元

    人机对话的浪潮:语音助手、聊天机器人、机器伴侣

    语音助手 2011年10月,乔布斯临终前在iPhone4S中加入了Siri功能,用户可以用语音对手机发号施令了,国内厂商随即跟进,当时国内一位企业家对我说,以前的搜索方式都错了,Siri方式是未来。 2012年,国内的语音助手产品纷纷上市,然而,经过市场的检验,两年过后,大陆的语音助手类产品从火爆到冷清,纷纷下马。 究其原因,主要有两个方面: 1. 几次使用失效后,用户开始调戏他的助手了,以至于原来用于闲聊的附属功能反而成了主角。调戏一段儿,用户发现机器实在太傻,干脆弃之不用,以至于语音助手产品的总用户量巨大,而留存量很小。 2. 小冰与语音助手有什么不同? 1. 以快速结束人机对话为目标(语音助手主要采用这种模式) 这又包括两种,一种是命令执行,一种是信息查询。

    2.5K80发布于 2018-03-13
  • 来自专栏IT技术分享社区

    DeepSeek系列:掌握这九个DeepSeek对话技巧,解锁AI高效能助手

    在人工智能飞速发展的今天,DeepSeek凭借其强大的AI能力,已经成为许多人提升工作效率和解决问题的得力助手。然而,要想真正发挥DeepSeek的潜力,关键在于掌握高效的提问技巧。 以下是九个实用的DeepSeek对话技巧,帮助你成为生活中的AI高手。1. 精准聚焦,直达核心DeepSeek的优势在于能够精准理解用户需求,但前提是你的问题必须明确。 4. 示例引导,场景明晰提供具体的输入/输出示例,可以帮助DeepSeek更好地理解需求。例如,与其问“怎么处理数据?” 通过精准提问、结构化描述、专业术语运用、分步提问等技巧,你可以让DeepSeek成为提高生产力、节省时间、增加收入的得力助手

    56120编辑于 2025-03-17
  • 来自专栏深度学习与python

    ChatGPT 正式进入车载系统:奔驰首测 AI 语音助手,可进行复杂对话

    梅赛德斯 - 奔驰表示,从 6 月 16 日开始,在美 90 万辆配备 MBUX 信息娱乐系统的车辆都可参与测试,使用 ChatGPT 驱动的语音助手。 注册完成后,车主便可以通过车载语音助手访问 ChatGPT。 对于此次合作,微软指出,车载 ChatGPT 能支持更动态的对话——不仅可以理解车主的语音命令,还可以进行交互式对话对话范围可以涵盖地点信息、菜谱、甚至是一些更加复杂的问题,进而让驾驶员的眼睛更专注于路况 与普通的语音助手不同,车载 ChatGPT 可以处理完整的对话,例如追问,并且能保持对前后文的理解。驾驶员可以提出复杂的问题或进行多轮对话,从语音助手那里收到详细的回复。

    47530编辑于 2023-08-09
  • 来自专栏GPUS开发者

    在Jetson上玩转大模型Day12:NanoLLM开发平台(2):语音对话助手

    -x509 -newkey rsa:4096 -keyout key.pem -out cert.pem -sha256 -days 365 -nodes -subj '/CN=localhost' 4. 现在使用NanoLLM开发环境重新搭建Llamaspeak应用,就变得非常简单,而且在旧版只支持语言对话的功能之上,还增加了对多模态大语言模型的支持,这样的使用性就变得非常高了。 model meta-llama/Meta-Llama-3-8B-Instruct --asr=riva --tts=piper 这里使用Meta-Llama-3-8B-Instruct模型,执行纯语言的对话

    70410编辑于 2024-11-19
  • 来自专栏新智元

    谷歌发布世界最大任务型对话数据集SGD,让虚拟助手更智能

    另外,各研究者也可将其用于对话技术创新。 这在一定程度上是由于缺乏合适的数据集,这些数据集无法与虚拟助手所面对的规模和复杂性相匹配。 SGD数据集由人类和虚拟助手之间超过18000条的带注释的任务型对话组成。这些对话涉及17个领域。 此方法不需要为助手设定master schema。相反,每个服务或API都会提供其模式功能及其相关属性的自然语言描述。然后,这些描述会用于学习模式的分布式语义表示,语义表示则会作为对话系统的附加输入。 “我们认为该数据集将会成为建立大规模对话模型的良好基准,” Rastogi和Khaitan称。“我们期待研究界将其用于对话技术的发展创新。”

    1.2K30发布于 2019-11-01
  • 对话即服务:Spring Boot整合MCP让你的CRUD系统秒变AI助手

    想象一下这样的场景:用户无需钻研复杂的API文档或者在繁琐的表单间来回切换,只需通过自然语言直接与系统对话——"帮我查找所有2023年出版的图书"、"创建一个新用户叫张三,邮箱是zhangsan@example.com ChatClient chatClient(ChatClient.Builder builder) { return builder .defaultSystem("你是一个图书管理助手 ChatClient chatClient(ChatClient.Builder builder) { return builder .defaultSystem("你是一个图书管理助手 小结 通过Spring Boot与MCP的整合,我们轻松实现了传统CRUD系统到智能AI助手的转变。MCP作为AI与服务之间的桥梁,极大简化了集成工作。 未来随着MCP生态发展,"对话即服务"将可能成为应用的开发范式,让复杂系统变得更加易用。

    6K92编辑于 2025-03-21
  • CodeBuddy Craft:AI重塑智能办公——对话式开发打造微信办公助手终极形态

    作为国内首个支持微软代码平台协议(MCP)的AI编程助手,它凭借革命性的Craft智能体,正在创造一种全新的可能:通过自然语言对话生成企业级应用,让每个普通职场人都能拥有专属的「数字分身」。 二、破界:Craft智能体的「对话式创造」‌ ‌‌ 需求对话是从混沌到具象的实现过程,而Craft表现出了堪称大师级别的理解能力,这次我们彻底不考虑代码,一行代码也不用自己动手写,将开发的细节工作抛之脑后 在与Craft的开发对话框输入战略指令: 请帮我实现小程序,希望能够开发出一个微信智能体或者说虚拟客服,我能登陆我自己的微信账号与其对话,它能提供上述三种提醒功能,并像微信聊天一样将提醒消息在聊天对话框发送给我 更令人惊喜的是,通过分析历史数据,助手会在每周三下午自动提醒:“检测到您本周已加班9小时,建议今日准点下班。” ‌2. 4. 任务中枢:从被动接受到主动掌控‌ 当团队主管在群里@熊猫分配新任务时,智能助手立即启动分析模式:综合当前待办事项量、历史任务完成质量、个人专业擅长领域,生成负荷承受系数评估。

    58020编辑于 2025-05-14
  • 来自专栏全栈程序员必看

    树莓派串口调试助手_树莓派4b教程

    转串口插入电脑USB口 使用串口软件(putty)打开对应串口 连接好USB转串口和树莓派 拔掉5V线,插上已烧录系统的内存卡 插上5V线,看串口软件是否有输出 若没有输出,则交换TXD、RXD线连接,重复4

    1.3K20编辑于 2022-11-07
  • 来自专栏骤雨重山

    ffmpeg任意视频批量转码MP4-H264助手

    简单的粗暴的小工具,利用windows命令行调用ffmpeg完成任意格式视频转换成H264编码的MP4视频,以确保视频可以在主流浏览器中直接播放,如:Chrome、Firefox等。 只需要将包含视频的文件夹或单个视频文件拖放到【视频转码助手.bat】图标上即可。 如果拖放的是文件夹,则会在该文件夹下生成一个名称为mp4的目录,用来存放转换完成的mp4视频,与原始视频文件同名,并且批量转换该文件夹下的所有视频。 如果拖放的是单个视频文件,则会在该视频文件相同目录下生成一个名称为mp4的目录,用来存放转换完成的mp4视频,与原始视频文件同名。转换速度依据电脑配置高低而定。 使用说明 拖放文件夹 拖放单个视频文件 正在处理 处理完成 任意视频批量转码MP4-H264助手 来源:蓝奏云网盘 https://vvhan.lanzoui.com/iaoX5ehas5e

    3.1K20编辑于 2022-01-17
领券