搜索 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

来自专栏生命科学与未来科学
脑控听觉技术让 “听你想听” 成真，重塑听觉健康未来
美国哥伦比亚大学祖克曼研究所研究团队首次直接证实，脑控听觉技术能在复杂环境中精准放大目标声音，相关成果已发表于《自然・神经科学》杂志，标志着听觉科技正式迈入 “脑控智能时代”。听觉皮层（Auditory Cortex）: 大脑中负责处理听觉信息的脑区。知觉学习（Perceptual Learning）: 经过训练后感知觉能力得到改善。普通人群：减轻听觉疲劳，适配多元场景不只是听障人士，普通人在嘈杂办公室、喧闹教室、拥挤聚会中，长期专注聆听易产生听觉疲劳与认知负荷。听觉科技行业：开辟新赛道，重构产业格局此次突破验证了脑机接口在听觉领域的应用可行性，为听觉设备行业开辟全新方向。未来，脑控听觉技术可与智能家居、语音助手、车载音频等场景融合，催生新型智能听觉产品，推动助听器从 “被动放大” 向 “主动智能” 升级，带动整个听觉健康产业的技术革新与市场扩容。
15910编辑于 2026-06-06
来自专栏脑机接口
ERP成分简介--听觉感觉反应
下图展示了一个由听觉刺激诱发的ERP成分，如果刺激时突然开始的（比如滴答声-a click），就会在首个10ms之内出现一系列独特的波峰，这反应了来自耳蜗的信息经过脑干传递到丘脑的过程。通常使用罗马数字对这些听觉脑干响应(Auditory Brainstem Responses, ABRs)进行标记。 ? 该响应可能至少部分来自于内侧膝状体和初级听觉皮层，如下图所示 ? 与视觉N1波形类似，当相邻刺激的间隔减小时，中潜伏期和长潜伏期听觉响应也会变小，而且不应期可能超过1000ms。与视觉N1波形类似，听觉N1波形也包含许多子成分，具体包括：一个可能产生于背侧颞叶听觉皮层，峰值大约在75ms的额叶中央区成分；一个源位置未知，峰值大约在100ms且头顶处幅值最大的电位；一个可能产生于额上回
94520发布于 2020-06-30
来自专栏一点人工一点智能
机器人视觉听觉融合的感知操作系统
随着人工智能技术的不断发展，在视觉识别[1-2]、自然语言系统[3-4]、三维场景建模[5-6]、操作抓取以及运动规划[7-8]方面都取得了极大的进展，使得各种先进的计算模型能够部署在机器人上帮助其更加智能化文献[23]通过给实际机器人配备听觉传感器，操作目标物体收集听觉数据，实现了对视觉上难以区分的目标的判别。为了获取数据的多样性，选取了1/4、1/2、2/3瓶子含量的数据。通过结合机械臂的运动特性，选择{Roll, Yaw, Pitch, Shake} 4种不同的动作分别对每类物品进行20次采样。如图8所示，在4种机器人的动作下，山楂和药片的声音具有相当大的差异性。 3.2.3 对交互听觉数据进行预处理在实际采集声音数据的过程中，机械臂在执行4种动作时有着不同的运动时长以及自身的运动噪声，这些噪声与运动的幅度、速度、加速度有关，会对采集的声音数据和实验结果产生一定的影响
1.3K30编辑于 2023-04-10
来自专栏程序那些事儿
OPPO智能电视R1带给你听觉盛宴
如果说OPPO手机是靠视觉影得了用户，那么OPPO智能电视一定是靠它的听觉影得到用户。提到OPPO智能电视，它的18个喇叭足矣震撼到任何人，85W的超大功率，带给你的是堪比影院级别的身临其境。同时它是支持全景杜比音效的，三维空间的环绕立体声让你享受到听觉盛宴。 “充电5分钟，通话两小时”，显示了OPPO智能手机的充电速度，而OPPO智能电视也有自己的闪电速度，那就是它的极快响应速度。它不仅拥有主流电视都标配的4K屏幕，同时还提供了HDR技术，可以让我们欣赏到更加明暗分明的细节，有了它，在黑暗的角落里，我们都能一网打尽。
28930编辑于 2023-03-07
来自专栏脑机接口
ERP成分简介--听觉感觉反应和视觉感觉反应
听觉感觉反应 ---- 下图展示了一个由听觉刺激诱发的ERP成分，如果刺激时突然开始的（比如滴答声-a click），就会在首个10ms之内出现一系列独特的波峰，这反应了来自耳蜗的信息经过脑干传递到丘脑的过程通常使用罗马数字对这些听觉脑干响应(Auditory Brainstem Responses, ABRs)进行标记。 ? 该响应可能至少部分来自于内侧膝状体和初级听觉皮层，如下图所示。 ? 与视觉N1波形类似，当相邻刺激的间隔减小时，中潜伏期和长潜伏期听觉响应也会变小，而且不应期可能超过1000ms。与视觉N1波形类似，听觉N1波形也包含许多子成分，具体包括：一个可能产生于背侧颞叶听觉皮层，峰值大约在75ms的额叶中央区成分；一个源位置未知，峰值大约在100ms且头顶处幅值最大的电位；一个可能产生于额上回
2K20发布于 2020-06-30
来自专栏思影科技
Science: 位于人类听觉皮层的语调编码
4个不同的语句：具有不同的音位组成。接下来作者为了检测语调编码是基于音高的心理声学属性而不是语言信息或者基频的声学能量，创建了两种非语言刺激，一种包含基频，一种不包含基频，但都保留了与语言刺激中相同的语调轮廓（图4）。图4：对语言和非语言中语调的神经响应类似。（A）一个语言示例的声学信号、音高轮廓和频谱。放大图中显示的声学信号表示语言独特的幅度准周期变化特征。综上所述，本研究直接证实了在人类听觉皮层颞上回，语言多个维度信息的共同提取，以及各个维度信息的单独编码。参考文献：Tang C, Hamilton L S, Chang E F.
1.4K80发布于 2018-04-08
来自专栏新智元
解锁通用听觉人工智能！清华电子系联合火山语音，开源全新认知导向听觉大语言模型
新智元报道编辑：好困【新智元导读】清华大学联合字节火山语音团队提出了一种全新的「听觉」大语言模型——SALMONN。日前，清华大学电子工程系与火山语音团队携手合作，推出认知导向的开源听觉大语言模型SALMONN (Speech Audio Language Music Open Neural Network)。整体来看，SALMONN 在三类不同难度的任务上都有较好表现，并涌现出惊艳的音频理解与推理能力，成功打通了音频与文本模态，初步展现出一定的通用听觉人工智能。
1.3K10编辑于 2023-09-09
来自专栏新智元
【张文强】“视听觉”深度学习将大展拳脚
张文强：我主攻音视频大数据的智能技术研究，基于视听觉的深度学习和媒介应用会在未来的新闻媒体产生巨大作用。当然，生物传感技术会在数据精确输入方面发挥作用，后续的智能处理、精准服务等更值得关注。
998130发布于 2018-03-14
来自专栏VoiceVista语音智能
听觉显示(Aural Relatity) - 超越互联网的连接
https://www.ceva-dsp.com/ourblog/aural-reality-connecting-beyond-the-internet/
68030发布于 2020-06-01
来自专栏脑机接口
脑信号分析系列(1)-听觉P300实验
听觉P300实验与视觉P300相似，但使用听觉刺激来产生oddball 刺激时间为200ms，时间间隔400ms,随机抖动±100ms, 任务是计算玩奇数球刺激的次数，记录单个参与者进行的6次2分钟的实验下面我们将使用4个不同的管道。 Vect+RL: 实验矢量化+Logistic回归。可以将其视为MEG/EEG中的标准解码管道。 results = pd.DataFrame(data=auc, columns=['AUC']) results['Method'] = methods fig = plt.figure(figsize=[8,4]
2.2K21发布于 2020-06-29
来自专栏音乐与健康
解码听觉奥秘：从频率到感知的奇妙旅程
本文带你一探人耳听觉的奥秘，从声音的基本属性到复杂的听觉机制，逐一解析人耳如何感知声音频率，并扩展探讨听觉的生理与心理特性。 02听觉的生理基础与耳的结构功能听觉系统对声音的感知是一个复杂而精细的过程，它涉及多个参数如频率、强度和音色的辨别。人耳作为听觉器官，其结构分为外耳、中耳和内耳，各自承担着不同的功能。听觉具有多种物理特性，如频率响应、动态范围、方向敏感度和掩蔽效应等，这些特性对于听觉传示装置的设计至关重要。了解听觉的这些心理特性有助于我们更好地利用听觉在人机交互、环境感知和信息传递中的优势。。内耳底膜上的柯蒂氏器是听觉系统的核心部分，其上布满起听觉感受器作用的毛细胞。毛细胞受到振动时，会引起神经末梢兴奋，产生电讯号，即将声能转换成神经冲动传至大脑皮层听觉区。3）听觉的物理特性：①频率响应。 C.听觉区域。由听阈与痛阈两条曲线所包围的部分称“听觉区域”。③方向敏感度。人耳的听觉效果，绝大部分都涉及所谓的“双耳效应”，或称“立体声效应”，这是正常的双耳听觉所具有的特性。
91610编辑于 2025-11-09
来自专栏有三AI
【语音处理】硬核介绍人体的感知和听觉特性
上一节主要介绍了关于语音信号产生的相关内容，本节将介绍和语音听觉相关的内容。本节主要介绍语音感知和听觉特性，包括人体的语音听觉系统，客观度量和主观听觉感受以及听觉特性三方面内容。通常而言，在人类听觉范围内，对于同一频率的声音，响度与声压级近似是正比例关系。对于频率因素而言，当声音强度一定的情况下，人耳对于3-4kHz频率之间的声音具有最大的响度感受，这是因为人的外耳道与该频率的声波发生共振；当频率极低或极高时，无论声音强度多大，人耳也无法感受响度。 3.人耳听觉特性 3.1 听阈与痛阈人耳只有在响度适中时才具有灵敏的辨音能力。在人耳的可听频率范围，声音强或弱到一定程度，人耳同样是听不见的，正常人听觉的声压级范围是0-140dB。 3.3 听觉延时效应当两个强度相同的声音在时间先后到达人耳时，听觉对先后到达的声音的延时做出分辨的特性称为听觉延时效应（哈斯效应）。
1.6K50编辑于 2022-05-24
来自专栏匠心一片
没错这就是机器听觉人工智能
说过了计算机视觉，我们来说说计算机听觉。如果说，视觉是人工智能的眼睛，那么听觉就是人工智能的耳朵。有的问题，需要眼睛发现，有的问题，则要用耳朵发现，当然，更多问题是用“心”发现，机器之心。。。
1.4K00发布于 2020-01-18
来自专栏思影科技
幻听中语言网络、听觉网络和记忆网络的交互障碍
（图1-4）以及混合模型。自上而下影响的增加应该反映在对该种的状态研究中，这些研究显示，无论是前额叶皮层(PFC)还是更高阶的知觉区域，都增加了与听觉知觉区域(如STG和颞中回(MTG))的连接（图1-4）。图3 记忆和情绪处理相关的脑区注：PHG 海马旁回，amygdala 杏仁核， Thalamus 丘脑（其他前文均有标注） 4. 4.1听觉网络相关区域的结构连接有大量证据表明AVHs患者的听觉处理存在缺陷。在休息时，初级听觉皮层的活动增强，而在执行听觉任务时，活动减弱。 4. 基于EEG的网络连接这一段主要是用脑电图研究AVH患者连接改变的研究。脑电图是对神经活动的直接测量。脑电图振荡或内在耦合模式，已被证明反映了调节大脑功能连接的关键机制。
1.8K10发布于 2020-02-24
来自专栏音乐与健康
意识障碍促醒之多感官刺激-听觉刺激（音乐治疗+干预）
听觉刺激是怎么起作用的呢？方法使用熟悉的声音和唤名，在听觉刺激中呼唤患者名字，每天安排家属与患者讲话，讲述以前可触动患者的事情及较难忘的事物。方法通过病人的亲友、同事了解和选择病人患病前喜欢的音乐，用播放器并与患者保持一定距离播放音量为70分贝以下，每日上午８点开始，间隔3h播放１次，每次播放30min，到下午５点停止，每日共播放4次。两侧听觉刺激要均匀，先从患者一侧耳朵刺激，然后换到另一侧。有以下情况对刺激无效果1、患者由于疲劳和觉醒状态不稳定，无法完成唤名任务。2、患者的听觉通路存在损害，不能如正常人一样完成听觉刺激的处理。 3、脑损伤造成的神经血管和听觉皮层的解剖结构的变化也可能导致听觉皮层不能激活。
56710编辑于 2025-07-01
来自专栏Alter聊科技
“听觉”营销价值凸显，喜马拉雅迎来新局点
就像市场调研和数据分析机构尼尔森IQ在《入耳更入心，润物细无声——网络音频媒体价值研究》中指出的，音频媒体以“好声音”为本质，带给听众更多听觉的感官盛宴。尼尔森在报告中引用了喜马拉雅的声音流贴片案例：闭屏状态下，喜马拉雅任意节目时长超过8分钟的免费专辑，在每期节目自动切换的过程中面向非会员用户和会员用户的30秒声音广告流正强化品牌在用户中的听觉+视觉印象加成
53830编辑于 2023-01-13
来自专栏机器之心
「听觉」引导「视觉」，OmniAgent开启全模态主动感知新范式
针对端到端全模态大模型（OmniLLMs）在跨模态对齐和细粒度理解上的痛点，浙江大学、西湖大学、蚂蚁集团联合提出 OmniAgent。这是一种基于「音频引导」的主动感知 Agent，通过「思考 - 行动 - 观察 - 反思」闭环，实现了从被动响应到主动探询的范式转变。
38910编辑于 2026-01-12
来自专栏思影科技
PNAS:感觉神经性听力损失降低空间选择性听觉注意
然后播放听觉流，0.7s的等待时间之后被试有1.5s按键时间报告靶标方位出现的听觉流轮廓是哪种，最后给予正确与否的反馈。听觉方位由双耳时间差（ITD）实现。对于正常听力被试（而非听力损失被试），对高音调的滞后听觉流（红色柱）比先行听觉流（蓝色柱）的表现更好。接着研究人员又考察了注意力对干扰流的第一个音符是否有影响，如图4所示，对两组被试来说，注意力都没有影响到干扰流的第一个音符。图4：无论是听力正常被试还是听力损失被试，干扰听觉流的首个音符都不被注意力的空间聚集所调制。（B）一小部分听力正常被试完成被动听觉对照试验的事件相关电位幅度，图画法类似A。被动听觉数据用绿色表示。
89140发布于 2018-06-11
来自专栏脑机接口
国外研究团队对意识(认知)评估听觉范式的新型改善方法
利用Oddball(新异刺激)听觉范式(后文中部分内容译为：反常听觉范式）进行意识情况识别已成为脑机接口(BCI)领域的一个重要研究课题。在一组9名健康被试人员中，在4种不同的Oddball听觉范式条件下记录被试者的脑电图(EEG)活动。为了进行对比，我们计算了每个范式下的P300曲线下的面积。更重要的是，我们发现与标准听觉范式相比，“名称范式”需要更少的试验刺激次数就能获得类似的结果。这意味着与使用正弦波相比，听觉范式的执行时间是可以被减少的。这种由音频触发适配器盒产生的触发信号可以防止与听觉刺激开始相关的脑电图信号的时基误差。电极位置包括FCZ, C3, CZ, C4, CP1, CPZ, CP2和PZ位置。参考电极置于右耳垂。 B.刺激在本研究中，使用了4种听觉范式，其中刺激的总数以及偏差刺激与标准刺激的比例都有所不同：(1) 7-1比例的正弦音调范式，共60个偏差刺激和420个标准刺激；(2) 5-1比例的正弦音调范式，共
1.3K40编辑于 2022-09-22
来自专栏机器之心
前沿 | 脑波打字，皮肤听觉：Facebook 展示全新人机交互技术
Verge 机器之心编译参与：李泽南、晏奇在刚刚结束的 F8 开发者大会上，Facebook 揭秘了 Building 8 研究部门的两项全新研究项目：让计算机直接读取人类的思想，通过皮肤实现听觉皮肤听觉项目除脑机接口项目之外，Facebook 还公布了另一项研究，新的皮肤听觉项目致力于让人类的皮肤获取信息，从而开启前所未有的交互方式。这项技术将允许聋哑人重新获得听觉。 Facebook 的工程师已经通过使用包含 16 个频段的原型系统验证了皮肤听觉的可行性。测试对象在实验中成功说出了他们通过皮肤「听」到的九个单词。作为 Facebook 旗下最神秘的研究部门，Building 8 于去年 4 月成立，致力于开发全新形式的消费硬件产品。该研究机构得到了 DARPA（美国政府国防高级研究计划署）的支持。原文链接：http://www.theverge.com/2017/4/19/15360798/facebook-brain-computer-interface-ai-ar-f8-2017 本文为机器之心编译
98680发布于 2018-05-07

第 2 页第 3 页第 4 页第 5 页第 6 页第 7 页第 8 页第 9 页第 10 页第 11 页

点击加载更多

脑控听觉技术让 “听你想听” 成真，重塑听觉健康未来

ERP成分简介--听觉感觉反应

机器人视觉听觉融合的感知操作系统

OPPO智能电视R1带给你听觉盛宴

ERP成分简介--听觉感觉反应和视觉感觉反应

Science: 位于人类听觉皮层的语调编码

解锁通用听觉人工智能！清华电子系联合火山语音，开源全新认知导向听觉大语言模型

【张文强】“视听觉”深度学习将大展拳脚

听觉显示(Aural Relatity) - 超越互联网的连接

脑信号分析系列(1)-听觉P300实验

解码听觉奥秘：从频率到感知的奇妙旅程

【语音处理】硬核介绍人体的感知和听觉特性

没错这就是机器听觉人工智能

幻听中语言网络、听觉网络和记忆网络的交互障碍

意识障碍促醒之多感官刺激-听觉刺激（音乐治疗+干预）

“听觉”营销价值凸显，喜马拉雅迎来新局点

「听觉」引导「视觉」，OmniAgent开启全模态主动感知新范式

PNAS:感觉神经性听力损失降低空间选择性听觉注意

国外研究团队对意识(认知)评估听觉范式的新型改善方法

前沿 | 脑波打字，皮肤听觉：Facebook 展示全新人机交互技术

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐