搜索 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

来自专栏生命科学与未来科学
脑控听觉技术让 “听你想听” 成真，重塑听觉健康未来
美国哥伦比亚大学祖克曼研究所研究团队首次直接证实，脑控听觉技术能在复杂环境中精准放大目标声音，相关成果已发表于《自然・神经科学》杂志，标志着听觉科技正式迈入 “脑控智能时代”。听觉皮层（Auditory Cortex）: 大脑中负责处理听觉信息的脑区。知觉学习（Perceptual Learning）: 经过训练后感知觉能力得到改善。普通人群：减轻听觉疲劳，适配多元场景不只是听障人士，普通人在嘈杂办公室、喧闹教室、拥挤聚会中，长期专注聆听易产生听觉疲劳与认知负荷。听觉科技行业：开辟新赛道，重构产业格局此次突破验证了脑机接口在听觉领域的应用可行性，为听觉设备行业开辟全新方向。未来，脑控听觉技术可与智能家居、语音助手、车载音频等场景融合，催生新型智能听觉产品，推动助听器从 “被动放大” 向 “主动智能” 升级，带动整个听觉健康产业的技术革新与市场扩容。
13510编辑于 2026-06-06
来自专栏脑机接口
ERP成分简介--听觉感觉反应
下图展示了一个由听觉刺激诱发的ERP成分，如果刺激时突然开始的（比如滴答声-a click），就会在首个10ms之内出现一系列独特的波峰，这反应了来自耳蜗的信息经过脑干传递到丘脑的过程。通常使用罗马数字对这些听觉脑干响应(Auditory Brainstem Responses, ABRs)进行标记。 ? 该响应可能至少部分来自于内侧膝状体和初级听觉皮层，如下图所示 ? 与视觉N1波形类似，当相邻刺激的间隔减小时，中潜伏期和长潜伏期听觉响应也会变小，而且不应期可能超过1000ms。与视觉N1波形类似，听觉N1波形也包含许多子成分，具体包括：一个可能产生于背侧颞叶听觉皮层，峰值大约在75ms的额叶中央区成分；一个源位置未知，峰值大约在100ms且头顶处幅值最大的电位；一个可能产生于额上回
93020发布于 2020-06-30
来自专栏脑机接口
ERP成分简介--听觉感觉反应和视觉感觉反应
听觉感觉反应 ---- 下图展示了一个由听觉刺激诱发的ERP成分，如果刺激时突然开始的（比如滴答声-a click），就会在首个10ms之内出现一系列独特的波峰，这反应了来自耳蜗的信息经过脑干传递到丘脑的过程通常使用罗马数字对这些听觉脑干响应(Auditory Brainstem Responses, ABRs)进行标记。 ? 该响应可能至少部分来自于内侧膝状体和初级听觉皮层，如下图所示。 ? 与视觉N1波形类似，当相邻刺激的间隔减小时，中潜伏期和长潜伏期听觉响应也会变小，而且不应期可能超过1000ms。与视觉N1波形类似，听觉N1波形也包含许多子成分，具体包括：一个可能产生于背侧颞叶听觉皮层，峰值大约在75ms的额叶中央区成分；一个源位置未知，峰值大约在100ms且头顶处幅值最大的电位；一个可能产生于额上回
1.9K20发布于 2020-06-30
来自专栏程序那些事儿
OPPO智能电视R1带给你听觉盛宴
如果说OPPO手机是靠视觉影得了用户，那么OPPO智能电视一定是靠它的听觉影得到用户。提到OPPO智能电视，它的18个喇叭足矣震撼到任何人，85W的超大功率，带给你的是堪比影院级别的身临其境。同时它是支持全景杜比音效的，三维空间的环绕立体声让你享受到听觉盛宴。 “充电5分钟，通话两小时”，显示了OPPO智能手机的充电速度，而OPPO智能电视也有自己的闪电速度，那就是它的极快响应速度。
28130编辑于 2023-03-07
来自专栏思影科技
Science: 位于人类听觉皮层的语调编码
综上所述，本研究直接证实了在人类听觉皮层颞上回，语言多个维度信息的共同提取，以及各个维度信息的单独编码。参考文献：Tang C, Hamilton L S, Chang E F.
1.4K80发布于 2018-04-08
来自专栏新智元
解锁通用听觉人工智能！清华电子系联合火山语音，开源全新认知导向听觉大语言模型
新智元报道编辑：好困【新智元导读】清华大学联合字节火山语音团队提出了一种全新的「听觉」大语言模型——SALMONN。日前，清华大学电子工程系与火山语音团队携手合作，推出认知导向的开源听觉大语言模型SALMONN (Speech Audio Language Music Open Neural Network)。整体来看，SALMONN 在三类不同难度的任务上都有较好表现，并涌现出惊艳的音频理解与推理能力，成功打通了音频与文本模态，初步展现出一定的通用听觉人工智能。
1.3K10编辑于 2023-09-09
来自专栏一点人工一点智能
机器人视觉听觉融合的感知操作系统
因此本文构建了一种基于视觉和听觉融合的机器人感知操作系统，该系统利用深度学习算法的模型实现了机器人的视觉感知和听觉感知，捕获自然语言操作指令和场景信息用于机器人的视觉定位，并为此收集了12类的声音信号数据用于音频识别文献[23]通过给实际机器人配备听觉传感器，操作目标物体收集听觉数据，实现了对视觉上难以区分的目标的判别。 2.2 音频分类模型 \alpha对于机器人的听觉感知部分，本文设计了一个音频分类模型，用于对收集的声音信号进行预测分类。 4.2 听觉分类结果为了使整个机器人听觉系统能够有效地工作，验证每种音频类别的精度是很有必要的。其中视觉感知模块能够分析指令中的指示关系，并且定位到目标物体，听觉感知模块能够预测目标物体类别。
1.3K30编辑于 2023-04-10
来自专栏新智元
【张文强】“视听觉”深度学习将大展拳脚
张文强：我主攻音视频大数据的智能技术研究，基于视听觉的深度学习和媒介应用会在未来的新闻媒体产生巨大作用。当然，生物传感技术会在数据精确输入方面发挥作用，后续的智能处理、精准服务等更值得关注。
985130发布于 2018-03-14
来自专栏VoiceVista语音智能
听觉显示(Aural Relatity) - 超越互联网的连接
https://www.ceva-dsp.com/ourblog/aural-reality-connecting-beyond-the-internet/
66230发布于 2020-06-01
来自专栏脑机接口
脑信号分析系列(1)-听觉P300实验
听觉P300实验与视觉P300相似，但使用听觉刺激来产生oddball 刺激时间为200ms，时间间隔400ms,随机抖动±100ms, 任务是计算玩奇数球刺激的次数，记录单个参与者进行的6次2分钟的实验
2.2K21发布于 2020-06-29
来自专栏音乐与健康
解码听觉奥秘：从频率到感知的奇妙旅程
本文带你一探人耳听觉的奥秘，从声音的基本属性到复杂的听觉机制，逐一解析人耳如何感知声音频率，并扩展探讨听觉的生理与心理特性。 02听觉的生理基础与耳的结构功能听觉系统对声音的感知是一个复杂而精细的过程，它涉及多个参数如频率、强度和音色的辨别。人耳作为听觉器官，其结构分为外耳、中耳和内耳，各自承担着不同的功能。听觉具有多种物理特性，如频率响应、动态范围、方向敏感度和掩蔽效应等，这些特性对于听觉传示装置的设计至关重要。了解听觉的这些心理特性有助于我们更好地利用听觉在人机交互、环境感知和信息传递中的优势。。内耳底膜上的柯蒂氏器是听觉系统的核心部分，其上布满起听觉感受器作用的毛细胞。毛细胞受到振动时，会引起神经末梢兴奋，产生电讯号，即将声能转换成神经冲动传至大脑皮层听觉区。3）听觉的物理特性：①频率响应。 C.听觉区域。由听阈与痛阈两条曲线所包围的部分称“听觉区域”。③方向敏感度。人耳的听觉效果，绝大部分都涉及所谓的“双耳效应”，或称“立体声效应”，这是正常的双耳听觉所具有的特性。
87510编辑于 2025-11-09
来自专栏匠心一片
没错这就是机器听觉人工智能
说过了计算机视觉，我们来说说计算机听觉。如果说，视觉是人工智能的眼睛，那么听觉就是人工智能的耳朵。有的问题，需要眼睛发现，有的问题，则要用耳朵发现，当然，更多问题是用“心”发现，机器之心。。。
1.4K00发布于 2020-01-18
来自专栏有三AI
【语音处理】硬核介绍人体的感知和听觉特性
上一节主要介绍了关于语音信号产生的相关内容，本节将介绍和语音听觉相关的内容。本节主要介绍语音感知和听觉特性，包括人体的语音听觉系统，客观度量和主观听觉感受以及听觉特性三方面内容。客观度量和主观听觉感受 2.1 声压当空气中没有声波时，空气处于平衡态，此时的静压强等于大气压。通常而言，在人类听觉范围内，对于同一频率的声音，响度与声压级近似是正比例关系。 3.人耳听觉特性 3.1 听阈与痛阈人耳只有在响度适中时才具有灵敏的辨音能力。在人耳的可听频率范围，声音强或弱到一定程度，人耳同样是听不见的，正常人听觉的声压级范围是0-140dB。 3.3 听觉延时效应当两个强度相同的声音在时间先后到达人耳时，听觉对先后到达的声音的延时做出分辨的特性称为听觉延时效应（哈斯效应）。
1.6K50编辑于 2022-05-24
来自专栏音乐与健康
意识障碍促醒之多感官刺激-听觉刺激（音乐治疗+干预）
听觉刺激是怎么起作用的呢？方法使用熟悉的声音和唤名，在听觉刺激中呼唤患者名字，每天安排家属与患者讲话，讲述以前可触动患者的事情及较难忘的事物。研究者还指出，多感音乐疗法对意识障碍的患者具有明显的促醒效果，增强呼吸反应，改善GCS评分，改善脑干听觉诱发电位结果。两侧听觉刺激要均匀，先从患者一侧耳朵刺激，然后换到另一侧。有以下情况对刺激无效果1、患者由于疲劳和觉醒状态不稳定，无法完成唤名任务。2、患者的听觉通路存在损害，不能如正常人一样完成听觉刺激的处理。 3、脑损伤造成的神经血管和听觉皮层的解剖结构的变化也可能导致听觉皮层不能激活。
53610编辑于 2025-07-01
来自专栏思影科技
幻听中语言网络、听觉网络和记忆网络的交互障碍
2.3半球间的听觉信息失调模型该假说认为，双侧听觉区域间的同步增强可能与AVH的神经关联有关。这一理论源于对耳鸣的研究，耳鸣是一种没有任何相应外部刺激的听觉感受。据报道，有更严重的幻觉的患者会表现出更大的图像对听觉感知的影响，提示自上而下的干扰对听觉感知的影响，研究者将此解释为自上而下影响听觉感知的干扰。幻听会形成更强烈的感官体验，从而激活听觉皮层(包括左STG;图1)，并且包含了大脑的语言听觉感知区域。作者回顾了症状关联研究和症状捕捉研究中出现的与听觉网络相关的研究结果。 4.1听觉网络相关区域的结构连接有大量证据表明AVHs患者的听觉处理存在缺陷。在休息时，初级听觉皮层的活动增强，而在执行听觉任务时，活动减弱。此外，初级和次级听觉皮层GM（灰质）体积的减少表明，听觉皮层自上而下的调节存在异常，这对连接听觉区域的通路的潜在WM的完整性提出了疑问。
1.8K10发布于 2020-02-24
来自专栏Alter聊科技
“听觉”营销价值凸显，喜马拉雅迎来新局点
就像市场调研和数据分析机构尼尔森IQ在《入耳更入心，润物细无声——网络音频媒体价值研究》中指出的，音频媒体以“好声音”为本质，带给听众更多听觉的感官盛宴。尼尔森在报告中引用了喜马拉雅的声音流贴片案例：闭屏状态下，喜马拉雅任意节目时长超过8分钟的免费专辑，在每期节目自动切换的过程中面向非会员用户和会员用户的30秒声音广告流正强化品牌在用户中的听觉+视觉印象加成
52530编辑于 2023-01-13
来自专栏机器之心
「听觉」引导「视觉」，OmniAgent开启全模态主动感知新范式
针对端到端全模态大模型（OmniLLMs）在跨模态对齐和细粒度理解上的痛点，浙江大学、西湖大学、蚂蚁集团联合提出 OmniAgent。这是一种基于「音频引导」的主动感知 Agent，通过「思考 - 行动 - 观察 - 反思」闭环，实现了从被动响应到主动探询的范式转变。
35910编辑于 2026-01-12
来自专栏机器之心
前沿 | 脑波打字，皮肤听觉：Facebook 展示全新人机交互技术
Verge 机器之心编译参与：李泽南、晏奇在刚刚结束的 F8 开发者大会上，Facebook 揭秘了 Building 8 研究部门的两项全新研究项目：让计算机直接读取人类的思想，通过皮肤实现听觉皮肤听觉项目除脑机接口项目之外，Facebook 还公布了另一项研究，新的皮肤听觉项目致力于让人类的皮肤获取信息，从而开启前所未有的交互方式。这项技术将允许聋哑人重新获得听觉。 Facebook 的工程师已经通过使用包含 16 个频段的原型系统验证了皮肤听觉的可行性。测试对象在实验中成功说出了他们通过皮肤「听」到的九个单词。
97880发布于 2018-05-07
来自专栏脑机接口
国外研究团队对意识(认知)评估听觉范式的新型改善方法
利用Oddball(新异刺激)听觉范式(后文中部分内容译为：反常听觉范式）进行意识情况识别已成为脑机接口(BCI)领域的一个重要研究课题。更重要的是，我们发现与标准听觉范式相比，“名称范式”需要更少的试验刺激次数就能获得类似的结果。这意味着与使用正弦波相比，听觉范式的执行时间是可以被减少的。使用正弦音调来引出P300活动的听觉范式响应已经被成功设计和于评估。此外，在之前的研究中也使用了受试者自己命名的刺激范式。本研究试图通过使用包含受试者自己的名字作为反常声音刺激，并减少标准和反常声音的刺激呈现次数，来减少在之前的研究中使用的一般条件的反常听觉刺激范式的测试时间。本研究使用了四种不同的反常听觉范式。对于前三种正弦听觉模式声音之间有一个700ms的延迟，而名字范式中延迟大约是1500ms。图2.实验工作流程示例。 ‍‍‍‍‍‍‍‍‍‍
1.3K40编辑于 2022-09-22
《从视觉到听觉：游戏状态信息的屏幕阅读器适配底层逻辑》
游戏状态信息是玩家与虚拟世界对话的桥梁，而屏幕阅读器适配的核心命题，在于如何将视觉化、碎片化的状态数据，转化为符合听觉接收习惯的结构化信息流。此前的开发历程中，我们常常陷入一个误区，认为只要将所有可见的状态参数逐一转化为文字播报，便能满足无障碍需求，却忽略了听觉与视觉在信息处理模式上的本质差异。视觉能够同时捕捉多个并行的信息点，玩家可以快速筛选关键内容，而听觉具有线性接收的特性，过量、无序的信息播报只会造成感官过载，让用户在庞杂的语音流中迷失方向。这就要求开发者从听觉认知的规律出发，将视觉化的信息层级转化为可被听觉感知的结构化表达。除了听觉元素的差异化设计，还需要构建“信息关联网络”，让不同状态信息之间形成逻辑关联，帮助用户建立完整的认知框架。
24810编辑于 2025-12-25

第 2 页第 3 页第 4 页第 5 页第 6 页第 7 页第 8 页第 9 页第 10 页第 11 页

点击加载更多

脑控听觉技术让 “听你想听” 成真，重塑听觉健康未来

ERP成分简介--听觉感觉反应

ERP成分简介--听觉感觉反应和视觉感觉反应

OPPO智能电视R1带给你听觉盛宴

Science: 位于人类听觉皮层的语调编码

解锁通用听觉人工智能！清华电子系联合火山语音，开源全新认知导向听觉大语言模型

机器人视觉听觉融合的感知操作系统

【张文强】“视听觉”深度学习将大展拳脚

听觉显示(Aural Relatity) - 超越互联网的连接

脑信号分析系列(1)-听觉P300实验

解码听觉奥秘：从频率到感知的奇妙旅程

没错这就是机器听觉人工智能

【语音处理】硬核介绍人体的感知和听觉特性

意识障碍促醒之多感官刺激-听觉刺激（音乐治疗+干预）

幻听中语言网络、听觉网络和记忆网络的交互障碍

“听觉”营销价值凸显，喜马拉雅迎来新局点

「听觉」引导「视觉」，OmniAgent开启全模态主动感知新范式

前沿 | 脑波打字，皮肤听觉：Facebook 展示全新人机交互技术

国外研究团队对意识(认知)评估听觉范式的新型改善方法

《从视觉到听觉：游戏状态信息的屏幕阅读器适配底层逻辑》

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐