首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏用户6167002的专栏

    智能语音交互入口的新未来

    百度近期加入了亚马逊发起的全球语音互操作性计划,为智能语音技术的进一步发展蓄力。 阿里与百度对智能语音的追逐绝非个例,整个互联网行业对智能语音技术重视的背后是智能语音技术极为广阔的市场。 智能语音技术自身交互的便利性,也促使它自身可以被运用到更为广泛的场景和行业中。相较于传统模式,智能语音技术在很大程度上解放了人们的双手和眼睛,为人们日常生活提供便利,也可以为特殊人群服务。 同时语音交互可以使机器实现自我学习,解决长期存在的人服务于机器的现状。这一自身的特点使得智能语音技术有了无可替代的优势。 同时,智能家居、可穿戴设施、智能车载等领域,智能语音将作为交互入口而发挥巨大作用。这一点,作为智能家居核心入口的智能音箱迅速扩大的市场,就足以说明智能语音的潜力。 从互联网革命到现在,人工智能的浪潮席卷而来,无数的成果正改变着这个时代。智能语音作为下一代人机交互入口,随着人工智能的不断发展,必将迎来更为广阔的天地。

    2.4K30发布于 2019-10-08
  • 语音交互·认知对话:智能语音互动查询系统重塑人机交互新范式

    语音查询迈入认知交互时代在移动优先与万物互联的产业背景下,传统语音查询系统面临语义理解浅层、场景适配僵化、多轮交互断裂等核心挑战。 智能语音互动查询系统通过融合语音识别、自然语言理解与对话管理技术,构建了从语音感知到认知决策的完整交互链条,实现了从"指令响应"到"智能对话"的体验升级。 场景迁移困难:单一场景训练的模型难以适应跨领域业务查询多轮对话断裂:缺乏对话状态跟踪,上下文信息流失严重个性化体验缺失:无法识别用户偏好,提供千人一面的标准回复实时响应延迟:复杂查询处理延迟超过 3 秒,影响交互体验智能语音交互架构系统构建 功能模块对比与效能提升功能模块传统语音查询智能语音交互系统效能提升幅度语音识别近场标准语音识别远场降噪 + 自适应识别识别准确率提升至 96.5%意图理解关键词模板匹配深度学习多意图识别意图识别准确率提升至 持续进化路径未来技术演进聚焦情感交互与跨模态融合:通过语音情感识别实现更具温度的交互体验;融合视觉、文本等多模态信息提升理解准确率;发展个性化自适应能力,使系统越用越智能;最终构建具备情感认知和深度推理能力的新一代语音交互系统

    32110编辑于 2025-10-30
  • 来自专栏AI语音

    【玩转腾讯云】【腾讯云语音合成】智能语音交互语音合成篇

    开篇前言 语音合成(Text To Speech,TTS)满足将文本转化成拟人化语音的需求,打通人机交互闭环。 语音合成广泛应用于语音导航、有声读物、机器人、语音助手、自动新闻播报等场景,提升人机交互体验,提高语音类应用构建效率。 3.打通人机交互的闭环,实现以假乱真的人机沟通效果 已经在使用合成效果不佳的客户,他们的用户通常因为TTS发声人声音僵硬,朗读不流畅等原因不愿意与机器人继续交流。 使用腾讯云TTS之后,他们的用户通常较难分辨发声人是真人还是机器人,使得人机交互的体验更好,用户更愿意与机器人交流 。 这里可以根据自身的场景选择需要的接口,对于实时性要求很高的场景,例如智能机器人对话,则可以采用流式合成,对于有声读物,语音播报场景可以选择非流式音频合成接口,客户可以在非流式的接口基础上实现预请求,即第一句合成播报的同时请求合成第二句话并缓存结果

    24.4K3730发布于 2020-05-04
  • 来自专栏VoiceVista语音智能

    Sensory推出智能家电语音交互解决方案

    Sensory,位于美国硅谷的边缘侧AI技术领导厂商(pioneering AI at the edge)于今日发布,基于Sensory TrulyNatural技术的,面向智能家电的智能语音助理解决方案 该技术帮助家电厂商,为其智能厨房电器提供脱离云端的边缘侧本地语音交互。 Sensory TrulyNatural为产品提供高度智能的自然语音交互界面(Extremely intelligent natural language user interface),所有语音交互在设备本地执行 “市场上有大量的基于云端的智能语音服务的产品,可以播放音乐,获取天气信息,甚至给你讲个笑话。 systems),机顶盒(set-top boxes),家庭自动化产品(home automation),移动APP和其他工业或企业应用,提供非常理想的用户语音交互体验。

    2.4K20发布于 2020-01-02
  • 来自专栏决策智能与机器学习

    AI预测技术在语音交互的落地 | 微软新一代全双工语音交互技术 | 智能语音 | 解读技术

    AI预测 近日,微软(亚洲)互联网工程院宣布率先推出新一代的语音交互技术:全双工语音交互感官(Full-duplex Voice Sense),与既有的单轮或多轮连续语音识别不同,这项新技术可实时预测人类即将说出的内容 ,实时生成回应并控制对话节奏,从而使长程语音交互成为可能。 在应用方面,米家生态链Yeelight语音助手是全球首个搭载全双工语音交互感官的智能设备,也是内置微软小冰的首个“双AI”智能设备。 另外人工智能能否主动引导抛出新话题,提供新内容,打破沉默是重要特征;还有随着全双工语音交互技术的普及,和人类一样的非对称对话模式。 语音交互是对话式人工智能智能硬件设备的基础之一。全双工语音交互技术的应用,有望实现用户体验的下一次飞跃,并成为人工智能语音交互的新“标准配置”。

    4.1K20发布于 2020-08-04
  • 来自专栏喔家ArchiSelf

    如何评测语音技能的智能程度(3)——交互流畅

    《如何评测语音技能的智能程度》是5篇系列文字,来自一位创业者,也是DuerOS开发者的投稿,老曹尽量不做变动和评价,尽量保持系列文章的原貌,这是第3篇。 这个模块,重点考量智能助手各个性能指标及交互体验层面的表现。 【交互流畅】(1)服务稳定性 “正常运行”、“不出bug”、“鲁棒性好”。 【交互流畅】(2)响应速度/流畅度 服务稳定性保障了之后,接下来就是速度。 语音交互这件事,本身就是因为语音输入的高效性。 而在智能语音助手交互对话的过程中,又包含哪几个阶段呢? ? 先明确一点,一味追求快并非是好。 而反馈样式则需要尽快呈现,有些智能助手语音播放完毕了,结果下面的内容还没加载到位。 5、人类总计2次交互,一次唤醒,一次表达意图,这2个行为过后,等待AI反馈。

    5.3K20发布于 2020-06-04
  • 来自专栏解洪文的专栏

    智能语音交互中的麦克风阵列技术

    后来Amazon发布Echo智能音箱,开启了智能硬件远场语音交互时代。 相比于Siri手机端近场的语音交互,Echo音箱的语音交互支持距离更远,交互更加自然便捷,它使用了麦克风阵列来保证远距离复杂背景噪声和干扰环境下的良好拾音效果,随后麦克风阵列逐渐成为了后续语音交互智能硬件的标配 image.png 2.为什么需要麦克风阵列 最初,语音交互应用最为普遍的就是以Siri为代表的智能手机助手,这个场景属于近场的语音交互,一般都是利用单麦克风在低噪声、低混响、距离声源很近的情况下获得符合语音识别需求的声音信号 3.4 回声消除 在智能音箱应用场景中,需要在播放音乐的时候仍然能够识别用户的语音交互指令,这时候,就需要从本地麦克风信号中去除本地扬声器播放的声音信号。 4.结语 本文简要介绍了智能语音交互前端广泛使用的麦克风阵列技术基本原理,并对其中部分方法进行了简要分析。

    13.1K70发布于 2019-08-01
  • 来自专栏思谱云汇人工智能

    智能语音机器人小知识(7)--什么是交互语音应答?

    IVR(Interactive Voice Response)即交互语音应答,可以提高呼叫服务的质量并节省费用。IVR是一种功能强大的电话自动服务系统。 为此,许多企业开始借助于信息化技术的应用,利用基于计算中心电话交互技术的呼叫中心来改善服务。 IVR2.png IVR交互语音应答技术的特点 IVR提供每周7天,每天24小时全天候服务。 顾客通过按键或语音选择,向企业主机输入信息,在允许范围内访问各类企业数据库,自助得到多种服务,令业务代表有更多的时间服务于有特别要求的顾客。 在容错方面,遇忙自动处理,以减少顾客不耐挂机;如遇线路故障自动报警等 IVR的文本与语音合成(Text-to-speech Synthesis)技术以事先录制好的清晰、圆润的音声为顾客服务。 IVR的多语种支持可根据不同要求用不同语言播放语音提示或咨询信息 IVR在各行业应用 银行为储户 帐户查询 各类卡激活 信用认证 基金查询 利率查询 姓名/住址变更 转帐 保险公司为保户 索赔/资格认证

    5.9K40发布于 2019-05-27
  • 来自专栏机器之心

    业界 | 阿里入局智能音箱,争夺智能家居语音交互入口

    作为淘宝网第一代产品经理,浅雪特别谈到开发音箱的产品设计理念:「在家庭环境下使用的一款产品,不应该是外观很大、只有大声音的智能设备,这是我们对这款产品的第一个思考,另一方面,语音交互这种方式将无所不在, 做得越来越小,才是语音交互助手终极追求方向。」 根据官方信息,阿里人工智能实验室正在对声纹识别、声纹购、NLP 中文对话引擎等核心技术申请专利。 下一代交互入口陷入混战 至此,这场由亚马逊带动起来的语音交互中国巷战,已经聚齐中国互联网巨头。 与几大巨头中最早推出音箱产品叮咚的京东、更专注于开放语音交互底层技术的 DuerOS 相比,腾讯云小微不仅仅聚焦在语音层面,服务于包括智能音箱在内的各类硬件产品以及机器人等,几乎对标于 Amazon 的 此外,叮咚还接入智能硬件平台——京东微联,从而使用户通过叮咚音箱的语音交互控制平台上的家电产品,包括生活电器、厨房电器、空调、可穿戴设备等。

    2.3K90发布于 2018-05-09
  • 来自专栏BestSDK

    交互新趋势,如何设计语音交互

    值得注意的是,最近几年针对语音交互的体验设计研究开始兴起:Android 和iOS 手机开始构建自己的语音交互生态,智能汽车为了解放双手,也开始研究语音交互的玩法。 怎样设计语音交互体验,才能使其发挥场景化的优势?Nielsen的启发式可用性原则依然适用于语音式的交互方案。 系统状态的视觉反馈 亚马逊的语音产品Echo,是一款场景化的语音交互智能硬件。 相比Siri和Google now,亚马逊的产品团队充分理解了语音交互场景化的潜在优势,并结合自己的电商基因,将Echo打造成了更加智能的私人家庭助理。 除了遵循尼尔森的启发式可用性原则之外,为了增强对场景化的理解,语音交互系统需要更加智能的去自主学习用户与环境,大数据的辅助也能够更好的加速这一进程。 总结 语音交互是更具有场景化的体验设计方法。 适当的语音反馈与引导可以帮助用户减轻记忆的压力,并避免用户迷失。充分借助云计算、大数据、神经网络、智能学习等技术来帮助语音交互系统增强对场景和用户的理解。

    2.7K90发布于 2018-02-27
  • 来自专栏AI科技大本营的专栏

    爱奇艺HomeAI智能语音交互系统的技术实践

    ,本期沙龙的干货分享我们会陆续发布,首先跟大家分享的是爱奇艺HomeAI智能语音交互系统及在语音交互系统的相关实践,以下为演讲实录。 今天跟大家分享爱奇艺HomeAI智能语音交互系统,主要分为五个部分,首先介绍HomeAI具体应用的领域,第二部分,跟大家剖析一下语音视频搜索和我们常规理解的视频搜索到底有何不同。 首先来看HomeAI智能语音交互系统:HomeAI是爱奇艺创新的智能应用和交互方式落地的平台,建立的初衷主要是从用户和视频这两个立足点出发。 通过对不同的声纹进行分析,语音交互设备会返回不同的搜索结果。 同样,我们在观看视频的过程当中也会存在用户环境,比如当前播放视频内容,播放进度,那这两个在语音交互中有何作用?后面我会介绍爱奇艺在视频内容理解和语音交互的结合领域所做的工作。

    2.6K10发布于 2020-02-12
  • 小智AI音箱:智能语音交互的未来之选

    小智AI音箱:智能语音交互的未来之选 在人工智能与物联网深度融合的时代,智能音箱已从简单的音频播放设备,演变为家庭智能中枢。 小智AI音箱作为新一代国产智能语音助手硬件代表,凭借其强大的技术底座、流畅的用户体验以及开放的开发生态,正逐步赢得市场青睐。 1.2 多模态交互语音 + 触控 + 视觉反馈 部分高端型号配备 2.8 英寸 LCD 屏幕,支持图形化交互。开发者可通过 小智 UI SDK 控制界面元素。 结语:不止是音箱,更是家庭AI伙伴 小智AI音箱通过 自研算法、多模态交互、隐私优先设计 与 开放开发者生态,构建了一个可持续进化的智能语音平台。无论是普通用户还是专业开发者,都能从中获得价值。 未来已来,只需一句“小智”,开启智能生活新篇章。

    54110编辑于 2025-12-23
  • 来自专栏喔家ArchiSelf

    再看语音交互设计

    赋能是人工智能对人类最重要的事情,而智能语音(例如DuerOS)正在为人机交互的方式赋能。声音一直是人与人沟通的核心,而今也成为了人机交互的核心——智能语音交互。 这些方法对于如今的智能语音交互同样有着借鉴的意义。 ? 离开了语境,就不可能理解话语背后的意义,对于语音交互设计而言,最重要的一点就是能利用已知的对话,可以针对以下情况结合人工智能和情感分析进行反馈: 用户的行为 用户的无行为(迟钝) 用户过去的行为 用户的一系列行为 关于可视化反馈 交互方式正在从单纯的视觉、硬件交互转化为多感官综合的交互,这种交互模式的本质是“关系”。VUI无疑是最重要也是最自然的交互通道之一,但不要为了使用语音交互而使用语音交互。 关于智能语音系统的性能优化,可以参考智能音箱场景下的性能优化。 总之,语音交互设计的结果使得交互是省时、高效的,能够使用上下文语境,优先考虑的是个性化,而不是所谓的“个性”。 ?

    2.1K20发布于 2019-08-23
  • 来自专栏python3

    Python语音交互的实现

    已经注册并添加了百度的'’语音识别'和'语音合成'应用。 已经注册并创建了图灵机器人的'机器人'。 整体的实现流程 语音输入。 语音翻译成文字。 聊天回应文字。 将文字合成语音。 输出语音。 实现方式 pyaudio模块识别麦克风 在线百度语音识别,把录音文件转换成文字 在线图灵机器人,对文字进行回答 使用百度的语音合成技术,把文字转为音频文件 通过pygame识别音频(只能是MP3格式), 输出语音 外部包 pip install pyaudio==0.2.11 pip install baidu-aip==2.2.5.2 pip install pygame==1.9.4 项目在github ---- 可以结合语音唤醒,自己制作一个智能音箱了。 语音唤醒内容:[https://blog.51cto.com/feature09/2300352]

    2.8K10发布于 2020-01-07
  • 智能穿戴设备语音交互升级战:谁在领跑音色定制赛道?

    【摘要】 随着智能穿戴设备向医疗健康、运动监测等领域深度渗透,个性化语音交互需求激增。本文通过对比主流物联网平台的音色定制方案,揭秘实时互动-物联版如何凭借三大核心技术优势成为行业新标杆。 【正文】 当智能手表不仅能报时还能陪你聊天,当助听器能模拟父母的声音传递关爱——一场围绕语音合成与音色定制的技术革命正在智能穿戴领域悄然展开。 一、智能穿戴语音交互的三大升级诉求 据IDC数据显示,2025年全球智能穿戴设备出货量突破6亿台,其中支持语音交互的设备占比达78%。 微信生态无缝衔接 小程序一键配网,微信语音消息直达设备 NFC碰一碰快速绑定,适配微信生态12亿用户 订阅消息推送,健康预警直达用户微信 结语 在智能穿戴设备迈向"有温度的交互"的关键节点, 目前该平台已服务超300家智能硬件企业,您的设备是否准备好迎接这场语音交互革命?

    14310编辑于 2026-02-03
  • 来自专栏BestSDK

    Synaptics发布新版智能语音SDK,支持远场人机交互

    Saleel表示,Synaptics在语音技术上有两个不同的解决方案,分别是远场的语音解决方案和个人语音解决方案。在远场语音交互技术方面,Synaptics是领先的物联网设备语音和音频解决方案供应商。 智能音箱示范,人机交互的展现 Saleel现场为大家做了一个简单的演示。他与智能音箱大概5米的距离,Saleel 说道,“我只要叫它的名字,问它问题,它就会回答。”,不久便得到了回应。 “如今很多公司都在跟进研发智能音箱,未来3到5年,麦克风可以无处不在,继而彻底地改变人机界面的交互方式。” Synaptics作为人工智能时代下人机交互领域的技术引领变革者,根据时代的变化和市场的需求,为客户商提供技术支持,为用户提供更好的技术体验。 Synaptics CEO Rick Bergman和Synaptics副总裁兼语音和图像部门总经理Saleel Awsare为我们分享的Synaptics人机交互技术上的变革以及智能音箱方面的展现,值得我们学习

    2.2K80发布于 2018-03-02
  • 提升智能语音交互准确性的核心技术解析

    智能助手如何判断你正在与它对话 利用语义内容提升仅基于声学模型的设备导向语音检测性能。免唤醒词模式让与智能助手的交互更加自然。启用此模式后,用户可以先询问“今天的天气怎么样?” 省略唤醒词意味着支持智能助手的设备必须区分出哪些语音是指向设备的,哪些不是。换句话说,它们需要区分像“明天呢?”这样的后续追问,与孩子们的喊叫声或电视里的声音。 过去,某中心的研究人员通过利用智能助手语音识别系统的组件,显著改善了设备导向语音的检测。 还使用了代表语音识别器对客户话语转录结果置信度的声学特征。这是智能助手团队在其检测设备导向性的最先进系统中采用方法的轻量级版本。 使用注意力机制来帮助模型锁定输入中那些对区分设备导向和非设备导向语音特别有用的词。迁移学习 最后,还使用迁移学习来改进模型的性能。即在多轮次交互上微调模型之前,先在单轮次交互数据上对模型进行预训练。

    21200编辑于 2025-12-22
  • 来自专栏智能相对论

    汽车AI语音交互 正在让机器交互更接近真人交互

    “重复唤醒,答非所问,这不是人工智能,是‘人工智障智障’。”这是大部分智能网联汽车用户对语音交互的抱怨。 现在,情况有了改善。当用户询问车机“明天出门需要带伞么?” 自然连续对话,是车载语音交互从“人工智障”迈向“人工智能”的重要一步。 01 从科幻到现实,语音交互一直在进化 提到智能语音交互,普罗大众对于技术刷屏的记忆停留在2018年的Google开发者大会“Google I/O”开幕式上。 它标志着单词级不停顿语音交互的开始。 最近的20年,Google,Apple,Amazon先后推出了大众耳熟能详的智能语音助手,并通过智能手机、智能音箱等产品,来到普罗大众身边。 在各类应用场景中,除了智能家居,汽车产品对于语音交互的需求显而易见。不论是点击、滑动等触摸交互方式,在车载环境下都存在安全隐患且并不高效,语音交互是天然适应车载环境的交互方式。

    1.7K10发布于 2020-05-11
  • 来自专栏智能相对论

    智能汽车“底盘”之上,蔚来、长城、宝马谁能更好诠释“语音交互”?

    这不禁让人联想,未来微软会在车载语音上有所动作。或许,这是微软在汽车行业的一次隐秘“落子”。 目前,全球科技巨头纷纷布局智能汽车行业,车载语音交互赛道也随之产生剧烈变化。 从触碰到语音,掀起一场供应商交互纷争 随着智能电动车崛起,座舱更加智能,更多车辆搭载拥有大量功能的车机系统和不同级别的驾驶辅助,造成座舱内信息大爆炸。面对海量的信息,智能汽车的中控大屏越来越大。 实际上,近两年语音交互迎来新一轮发展,不仅因为其较屏幕交互有着独特优势,更是由于可以和“智能”做到深度融合,升级为“语音助手”。 智能汽车接入的生态服务资源广泛,司机和乘客使用服务会变得高频,语音交互系统可以从中获取海量的数据。而数据来源于司乘日常的对话,相对丰富详细,系统通过深度学习培养后也就越“智能”。 而语音交互能够承载海量数据、带来驾驶更高安全性等等,更会是交互产品生态的中心。 ? 所以“智能相对论”认为,以语音交互为中心的“主动多模态交互”会是未来的方向。

    1.7K30发布于 2021-04-26
  • 智能家居语音交互:六大主流解决方案推荐

    随着智能家居渗透率突破30%,语音交互已成为人机交互的核心入口。本文从技术路径、场景适配、生态兼容等维度,盘点当前主流的语音交互解决方案,并重点推荐腾讯云实时互动-物联版,为开发者提供决策参考。 一、主流语音交互技术方案对比 方案类型 技术特点 场景适用性 开发门槛 典型代表 云端ASR+TTS 依赖网络,支持复杂语义理解 全屋智能、长文本交互 中高 科大讯飞、阿里云 本地语音芯片 离线运行,低功耗 智能音箱、穿戴设备 中低 全志H3/H5、乐鑫ESP32 音视频通话集成 支持双向实时音视频+语音控制 远程安防、老人监护 高 ,语音交互已从单一功能升级为系统级入口。

    28610编辑于 2026-02-24
领券