首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏脑机接口

    ERP成分简介--听觉感觉反应

    下图展示了一个由听觉刺激诱发的ERP成分,如果刺激时突然开始的(比如滴答声-a click),就会在首个10ms之内出现一系列独特的波峰,这反应了来自耳蜗的信息经过脑干传递到丘脑的过程。 通常使用罗马数字对这些听觉脑干响应(Auditory Brainstem Responses, ABRs)进行标记。 ? 该响应可能至少部分来自于内侧膝状体和初级听觉皮层,如下图所示 ? 与视觉N1波形类似,当相邻刺激的间隔减小时,中潜伏期和长潜伏期听觉响应也会变小,而且不应期可能超过1000ms。 与视觉N1波形类似,听觉N1波形也包含许多子成分,具体包括: 一个可能产生于背侧颞叶听觉皮层,峰值大约在75ms的额叶中央区成分; 一个源位置未知,峰值大约在100ms且头顶处幅值最大的电位; 一个可能产生于额上回

    86020发布于 2020-06-30
  • 来自专栏思影科技

    Science: 位于人类听觉皮层的语调编码

    综上所述,本研究直接证实了在人类听觉皮层颞上回,语言多个维度信息的共同提取,以及各个维度信息的单独编码。 参考文献:Tang C, Hamilton L S, Chang E F.

    1.3K80发布于 2018-04-08
  • 来自专栏新智元

    解锁通用听觉人工智能!清华电子系联合火山语音,开源全新认知导向听觉大语言模型

    新智元报道 编辑:好困 【新智元导读】清华大学联合字节火山语音团队提出了一种全新的「听觉」大语言模型——SALMONN。 日前,清华大学电子工程系与火山语音团队携手合作,推出认知导向的开源听觉大语言模型SALMONN (Speech Audio Language Music Open Neural Network)。 整体来看,SALMONN 在三类不同难度的任务上都有较好表现,并涌现出惊艳的音频理解与推理能力,成功打通了音频与文本模态,初步展现出一定的通用听觉人工智能。

    93010编辑于 2023-09-09
  • 来自专栏程序那些事儿

    OPPO智能电视R1带给你听觉盛宴

    如果说OPPO手机是靠视觉影得了用户,那么OPPO智能电视一定是靠它的听觉影得到用户。 提到OPPO智能电视,它的18个喇叭足矣震撼到任何人,85W的超大功率,带给你的是堪比影院级别的身临其境。 同时它是支持全景杜比音效的,三维空间的环绕立体声让你享受到听觉盛宴。 “充电5分钟,通话两小时”,显示了OPPO智能手机的充电速度,而OPPO智能电视也有自己的闪电速度,那就是它的极快响应速度。

    25330编辑于 2023-03-07
  • 来自专栏脑机接口

    ERP成分简介--听觉感觉反应和视觉感觉反应

    听觉感觉反应 ---- 下图展示了一个由听觉刺激诱发的ERP成分,如果刺激时突然开始的(比如滴答声-a click),就会在首个10ms之内出现一系列独特的波峰,这反应了来自耳蜗的信息经过脑干传递到丘脑的过程 通常使用罗马数字对这些听觉脑干响应(Auditory Brainstem Responses, ABRs)进行标记。 ? 该响应可能至少部分来自于内侧膝状体和初级听觉皮层,如下图所示。 ? 与视觉N1波形类似,当相邻刺激的间隔减小时,中潜伏期和长潜伏期听觉响应也会变小,而且不应期可能超过1000ms。 与视觉N1波形类似,听觉N1波形也包含许多子成分,具体包括: 一个可能产生于背侧颞叶听觉皮层,峰值大约在75ms的额叶中央区成分; 一个源位置未知,峰值大约在100ms且头顶处幅值最大的电位; 一个可能产生于额上回

    1.8K20发布于 2020-06-30
  • 来自专栏新智元

    【张文强】“视听觉”深度学习将大展拳脚

    张文强:我主攻音视频大数据的智能技术研究,基于视听觉的深度学习和媒介应用会在未来的新闻媒体产生巨大作用。当然,生物传感技术会在数据精确输入方面发挥作用,后续的智能处理、精准服务等更值得关注。

    917130发布于 2018-03-14
  • 来自专栏一点人工一点智能

    机器人视觉听觉融合的感知操作系统

    因此本文构建了一种基于视觉和听觉融合的机器人感知操作系统,该系统利用深度学习算法的模型实现了机器人的视觉感知和听觉感知,捕获自然语言操作指令和场景信息用于机器人的视觉定位,并为此收集了12类的声音信号数据用于音频识别 文献[23]通过给实际机器人配备听觉传感器,操作目标物体收集听觉数据,实现了对视觉上难以区分的目标的判别。 2.2 音频分类模型 \alpha对于机器人的听觉感知部分,本文设计了一个音频分类模型,用于对收集的声音信号进行预测分类。 4.2 听觉分类结果 为了使整个机器人听觉系统能够有效地工作,验证每种音频类别的精度是很有必要的。 其中视觉感知模块能够分析指令中的指示关系,并且定位到目标物体,听觉感知模块能够预测目标物体类别。

    1.1K30编辑于 2023-04-10
  • 来自专栏脑机接口

    脑信号分析系列(1)-听觉P300实验

    听觉P300实验与视觉P300相似,但使用听觉刺激来产生oddball 刺激时间为200ms,时间间隔400ms,随机抖动±100ms, 任务是计算玩奇数球刺激的次数,记录单个参与者进行的6次2分钟的实验

    2.1K21发布于 2020-06-29
  • 来自专栏VoiceVista语音智能

    听觉显示(Aural Relatity) - 超越互联网的连接

    https://www.ceva-dsp.com/ourblog/aural-reality-connecting-beyond-the-internet/

    58530发布于 2020-06-01
  • 来自专栏音乐与健康

    解码听觉奥秘:从频率到感知的奇妙旅程

    本文带你一探人耳听觉的奥秘,从声音的基本属性到复杂的听觉机制,逐一解析人耳如何感知声音频率,并扩展探讨听觉的生理与心理特性。 02听觉的生理基础与耳的结构功能听觉系统对声音的感知是一个复杂而精细的过程,它涉及多个参数如频率、强度和音色的辨别。人耳作为听觉器官,其结构分为外耳、中耳和内耳,各自承担着不同的功能。 听觉具有多种物理特性,如频率响应、动态范围、方向敏感度和掩蔽效应等,这些特性对于听觉传示装置的设计至关重要。了解听觉的这些心理特性有助于我们更好地利用听觉在人机交互、环境感知和信息传递中的优势。。 内耳底膜上的柯蒂氏器是听觉系统的核心部分,其上布满起听觉感受器作用的毛细胞。毛细胞受到振动时,会引起神经末梢兴奋,产生电讯号,即将声能转换成神经冲动传至大脑皮层听觉区。3)听觉的物理特性:①频率响应。 C.听觉区域。由听阈与痛阈两条曲线所包围的部分称“听觉区域”。③方向敏感度。人耳的听觉效果,绝大部分都涉及所谓的“双耳效应”,或称“立体声效应”,这是正常的双耳听觉所具有的特性。

    60910编辑于 2025-11-09
  • 来自专栏匠心一片

    没错这就是机器听觉人工智能

    说过了计算机视觉,我们来说说计算机听觉。 如果说,视觉是人工智能的眼睛,那么听觉就是人工智能的耳朵。 有的问题,需要眼睛发现,有的问题,则要用耳朵发现,当然,更多问题是用“心”发现,机器之心。。。

    1.4K00发布于 2020-01-18
  • 来自专栏有三AI

    【语音处理】硬核介绍人体的感知和听觉特性

    上一节主要介绍了关于语音信号产生的相关内容,本节将介绍和语音听觉相关的内容。 本节主要介绍语音感知和听觉特性,包括人体的语音听觉系统,客观度量和主观听觉感受以及听觉特性三方面内容。 客观度量和主观听觉感受 2.1 声压 当空气中没有声波时,空气处于平衡态,此时的静压强等于大气压。 通常而言,在人类听觉范围内,对于同一频率的声音,响度与声压级近似是正比例关系。 3.人耳听觉特性 3.1 听阈与痛阈 人耳只有在响度适中时才具有灵敏的辨音能力。在人耳的可听频率范围,声音强或弱到一定程度,人耳同样是听不见的,正常人听觉的声压级范围是0-140dB。 3.3 听觉延时效应 当两个强度相同的声音在时间先后到达人耳时,听觉对先后到达的声音的延时做出分辨的特性称为听觉延时效应(哈斯效应)。

    1.4K50编辑于 2022-05-24
  • 来自专栏音乐与健康

    意识障碍促醒之多感官刺激-听觉刺激(音乐治疗+干预)

    听觉刺激是怎么起作用的呢? 方法使用熟悉的声音和唤名,在听觉刺激中呼唤患者名字,每天安排家属与患者讲话,讲述以前可触动患者的事情及较难忘的事物。 研究者还指出,多感音乐疗法对意识障碍的患者具有明显的促醒效果,增强呼吸反应,改善GCS评分,改善脑干听觉诱发电位结果。 两侧听觉刺激要均匀,先从患者一侧耳朵刺激,然后换到另一侧。有以下情况对刺激无效果1、患者由于疲劳和觉醒状态不稳定,无法完成唤名任务。2、患者的听觉通路存在损害,不能如正常人一样完成听觉刺激的处理。 3、脑损伤造成的神经血管和听觉皮层的解剖结构的变化也可能导致听觉皮层不能激活。

    41210编辑于 2025-07-01
  • 来自专栏思影科技

    幻听中语言网络、听觉网络和记忆网络的交互障碍

    2.3半球间的听觉信息失调模型 该假说认为,双侧听觉区域间的同步增强可能与AVH的神经关联有关。这一理论源于对耳鸣的研究,耳鸣是一种没有任何相应外部刺激的听觉感受。 据报道,有更严重的幻觉的患者会表现出更大的图像对听觉感知的影响,提示自上而下的干扰对听觉感知的影响,研究者将此解释为自上而下影响听觉感知的干扰。 幻听会形成更强烈的感官体验,从而激活听觉皮层(包括左STG;图1),并且包含了大脑的语言听觉感知区域。作者回顾了症状关联研究和症状捕捉研究中出现的与听觉网络相关的研究结果。 4.1听觉网络相关区域的结构连接 有大量证据表明AVHs患者的听觉处理存在缺陷。在休息时,初级听觉皮层的活动增强,而在执行听觉任务时,活动减弱。 此外,初级和次级听觉皮层GM(灰质)体积的减少表明,听觉皮层自上而下的调节存在异常,这对连接听觉区域的通路的潜在WM的完整性提出了疑问。

    1.8K10发布于 2020-02-24
  • 来自专栏Alter聊科技

    听觉”营销价值凸显,喜马拉雅迎来新局点

    就像市场调研和数据分析机构尼尔森IQ在《入耳更入心,润物细无声——网络音频媒体价值研究》中指出的,音频媒体以“好声音”为本质,带给听众更多听觉的感官盛宴。 尼尔森在报告中引用了喜马拉雅的声音流贴片案例:闭屏状态下,喜马拉雅任意节目时长超过8分钟的免费专辑,在每期节目自动切换的过程中面向非会员用户和会员用户的30秒声音广告流正强化品牌在用户中的听觉+视觉印象加成

    47730编辑于 2023-01-13
  • 来自专栏机器之心

    听觉」引导「视觉」,OmniAgent开启全模态主动感知新范式

    针对端到端全模态大模型(OmniLLMs)在跨模态对齐和细粒度理解上的痛点,浙江大学、西湖大学、蚂蚁集团联合提出 OmniAgent。这是一种基于「音频引导」的主动感知 Agent,通过「思考 - 行动 - 观察 - 反思」闭环,实现了从被动响应到主动探询的范式转变。

    19910编辑于 2026-01-12
  • 来自专栏机器之心

    前沿 | 脑波打字,皮肤听觉:Facebook 展示全新人机交互技术

    Verge 机器之心编译 参与:李泽南、晏奇 在刚刚结束的 F8 开发者大会上,Facebook 揭秘了 Building 8 研究部门的两项全新研究项目:让计算机直接读取人类的思想,通过皮肤实现听觉 皮肤听觉项目 除脑机接口项目之外,Facebook 还公布了另一项研究,新的皮肤听觉项目致力于让人类的皮肤获取信息,从而开启前所未有的交互方式。 这项技术将允许聋哑人重新获得听觉。 Facebook 的工程师已经通过使用包含 16 个频段的原型系统验证了皮肤听觉的可行性。测试对象在实验中成功说出了他们通过皮肤「听」到的九个单词。

    93880发布于 2018-05-07
  • 来自专栏脑机接口

    国外研究团队对意识(认知)评估听觉范式的新型改善方法

    利用Oddball(新异刺激)听觉范式(后文中部分内容译为:反常听觉范式)进行意识情况识别已成为脑机接口(BCI)领域的一个重要研究课题。 更重要的是,我们发现与标准听觉范式相比,“名称范式”需要更少的试验刺激次数就能获得类似的结果。这意味着与使用正弦波相比,听觉范式的执行时间是可以被减少的。 使用正弦音调来引出P300活动的听觉范式响应已经被成功设计和于评估。此外,在之前的研究中也使用了受试者自己命名的刺激范式。 本研究试图通过使用包含受试者自己的名字作为反常声音刺激,并减少标准和反常声音的刺激呈现次数,来减少在之前的研究中使用的一般条件的反常听觉刺激范式的测试时间。本研究使用了四种不同的反常听觉范式。 对于前三种正弦听觉模式声音之间有一个700ms的延迟,而名字范式中延迟大约是1500ms。 图2.实验工作流程示例。 ‍‍‍‍‍‍‍‍‍‍

    1.2K40编辑于 2022-09-22
  • 《从视觉到听觉:游戏状态信息的屏幕阅读器适配底层逻辑》

    游戏状态信息是玩家与虚拟世界对话的桥梁,而屏幕阅读器适配的核心命题,在于如何将视觉化、碎片化的状态数据,转化为符合听觉接收习惯的结构化信息流。 此前的开发历程中,我们常常陷入一个误区,认为只要将所有可见的状态参数逐一转化为文字播报,便能满足无障碍需求,却忽略了听觉与视觉在信息处理模式上的本质差异。 视觉能够同时捕捉多个并行的信息点,玩家可以快速筛选关键内容,而听觉具有线性接收的特性,过量、无序的信息播报只会造成感官过载,让用户在庞杂的语音流中迷失方向。 这就要求开发者从听觉认知的规律出发,将视觉化的信息层级转化为可被听觉感知的结构化表达。 除了听觉元素的差异化设计,还需要构建“信息关联网络”,让不同状态信息之间形成逻辑关联,帮助用户建立完整的认知框架。

    15810编辑于 2025-12-25
  • 来自专栏思影科技

    PNAS:感觉神经性听力损失降低空间选择性听觉注意

    然后播放听觉流,0.7s的等待时间之后被试有1.5s按键时间报告靶标方位出现的听觉流轮廓是哪种,最后给予正确与否的反馈。听觉方位由双耳时间差(ITD)实现。 (A)每一个试次等时呈现三个听觉流,每一个都由一个高音和一个低音组成一段旋律。每一个听觉流的起始音符都在时间上错开以便于记录独立的EEG响应。 左右听觉流的耳间时间差要么都小要么都大,依赖于当前试次。被试被提示在每个试次结束时去识别靶标听觉流的旋律轮廓,并在他们响应之后提供反馈。 对于正常听力被试(而非听力损失被试),对高音调的滞后听觉流(红色柱)比先行听觉流(蓝色柱)的表现更好。 (B)一小部分听力正常被试完成被动听觉对照试验的事件相关电位幅度,图画法类似A。被动听觉数据用绿色表示。

    84240发布于 2018-06-11
领券