首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏知识点分享

    声学简介

    什么是声学声学是研究声音的物理学,研究内容包括声信号的产生、传输和检测等所有与之相关的多物理学科。 声学范围 下载LMS Virtual.Lab 声学手册在声学中,声音由传播介质产生、在其中传播并受其影响,最终被人们检测、感知并进行分析。 例如,音乐家用钢琴演奏出美妙的音符(音乐);有些工程师研究拾音麦克风,而其他一些工程师则通过扬声器对声音的再现进行优化(电声学);建筑师和土木工程师确保声音在音乐厅完美再现(室内声学);听者的耳朵接收声音 显而易见,声学在本质上涉及多个学科和多个物理场。在这里,我们主要讨论与工程和地球科学相关的声学物理原理。 有关声学的详细分类,请参见《美国声学学会杂志》(Journal of the Acoustical Society of America) 使用的 PACS classification。

    1.2K20编辑于 2022-06-01
  • 来自专栏深度应用

    ·主流声学模型对比

    主流声学模型对比 目录 概述 基础概念 语音帧 语音识别系统 主流声学建模技术 HMM DNN-HMM FFDNN CNN RNN及LSTM CTC 其他建模技术 语言建模技术 语音唤醒技术 关于未来 简单来说,声学模型的任务就是描述语音的物理变化规律,而语言模型则表达了自然语言包含的语言学知识。 (编者注:分帧后的语音信号逐帧提取语音特征用于声学模型建模。) ? 识别的公式如图4所示,可见声学模型主要描述发音模型下特征的似然概率;语言模型主要描述词间的连接概率;发音词典主要是完成词和音之间的转换,其中声学模型建模单元一般选择三音素模型,以“搜狗语音为例”, sil-s 主流声学建模技术 近年来,随着深度学习的兴起,使用了接近30年的语音识别声学模型HMM(隐马尔科夫模型)逐渐被DNN(泛指深度神经网络)所替代,模型精度也有了突飞猛进的变化,整体来看声学建模技术从建模单元

    4K22发布于 2019-06-27
  • 来自专栏深度学习|机器学习|歌声合成|语音合成

    声学特征提取and WORLD Using

    声谱图(Spectrogram) image.png 这段语音被分为很多帧,每帧语音都对应于一个频谱(通过短时FFT计算),频谱表示频率与能量的关系。在实际使用中,频谱图有三种,即线性振幅谱、对数振幅谱、自功率谱(对数振幅谱中各谱线的振幅都作了对数计算,所以其纵坐标的单位是dB(分贝)。这个变换的目的是使那些振幅较低的成分相对高振幅成分得以拉高,以便观察掩盖在低幅噪声中的周期信号)。 image.png 我们先将其中一帧语音的频谱通过坐标表示出来,如上图左。现在我们将左边的频谱旋转90度。得到中

    67410发布于 2021-01-14
  • 来自专栏硬件大熊

    浅析硬件“好声音”: 声学器件

    音视频硬件中,声学器件是必不可少的基础元件,声学器件主要包括麦克风和喇叭,麦克风拾取声音,喇叭播放声音。 所以归麦克风凭借其良好的性能,迅速成为消费类产品的首选声学元器件。如下图所示为两种类型麦克风的示例图。

    1.6K20编辑于 2022-06-23
  • 来自专栏音乐与健康

    解析声音“疗伤”的密码(音波声学

    柏林声学实验室更发现。低频段(60-80Hz)音波能像物理按摩般刺激副交感神经。古琴大师龚一演奏的《流水》。每个泛音间隔0.8秒。恰好匹配深度呼吸的黄金节奏。

    37110编辑于 2025-10-25
  • 来自专栏AI机器学习与深度学习算法

    学习分类 2-3 感知机

    要如何求出权重向量呢?基本做法和回归时相同,将权重向量用作参数,创建更新表达式来更新参数。这就需要一个被称为感知机的模型。

    67310编辑于 2022-11-08
  • 来自专栏全栈程序员必看

    基于Speex的声学回声消除

    所谓声学回声消除,是为了解决VoIP(网络电话)中这样一个问题:即A与B进行通话,A端有麦克风和扬声器分别用来采集A的声音和播放B的声音,B端有麦克风和扬声器分别用来采集B的声音和播放 声学回声消除一般可以通过硬件和软件分别实现,目前来说,硬件实现比较简单,软件实现较难,这里的难并不是说回声消除算法很难,而是在应用算法时的实时同步问题很难,目前软件实现较好的应该是微软,但似乎也对硬件配置和操作系统有要求 而Speex提供了声学回声消除算法库,本文就简单用Speex对一段录音进行回声消除,当然这不是实时处理的。

    4.6K20编辑于 2022-11-16
  • 来自专栏算法无遗策

    动画 | 什么是2-3树?

    2-3树正是一种绝对平衡的树,任意节点到它所有的叶子节点的深度都是相等的。 2-3树的数字代表一个节点有2到3个子树。它也满足二分搜索树的基本性质,但它不属于二分搜索树。 2-3树查找元素 2-3树的查找类似二分搜索树的查找,根据元素的大小来决定查找的方向。 动画:2-3树插入 2-3树删除元素 2-3树删除元素相对比较复杂,删除元素也和插入元素一样先进行命中查找,查找成功才进行删除操作。 2-3树为满二叉树时,删除叶子节点 2-3树满二叉树的情况下,删除叶子节点是比较简单的。 动画:2-3树删除 -----END---

    1.1K10发布于 2020-01-02
  • 来自专栏深度学习|机器学习|歌声合成|语音合成

    语音合成-声学概念和变声变调

    声学概念 声音是靠波来传播的,区别任何的声音需要依据三个来区分:响度、音高和音色 响度 音高:声音具有确定的音高,声音就可以使空气以笃定的方式运行。低音就是频率低。 频谱:描述各种波的振幅的大小的图叫做频谱图,这在声学中是相当的重要的。

    1.7K10发布于 2021-01-14
  • 来自专栏进击的多媒体开发

    声学工程师应知道的150个声学基础知识(全篇)

    和大家分享一下声学工程师应知道的150个声学基础知识。 注意,声学工程师和音频工程师可不是同一岗位,前者会更侧重于硬件,后者侧重于软件层面。但是关于声音的一些基础内容还是相同的,可以多多了解!!! 以下是全部的基础知识,内容来源于 声学楼论坛 。 1、 人耳能听到的频率范围是20Hz—20KHz。 2、 把声能转换成电能的设备是传声器。 3、 把电能转换成声能的设备是扬声器。

    4.3K20编辑于 2022-10-31
  • 来自专栏我是攻城师

    什么是2-3

    2-3树 VS 二叉搜索树 同样的一组数据,在2-3树和二叉搜索树里面的对比如下: ? 可以看到2-3树的节点分布非常均匀,且叶子节点的高度一致,并且如果这里即使是AVL树,那么树的高度也比2-3树高,而高度的降低则可以提升增删改的效率。 2-3树的插入 为了保持平衡性,2-3树的插入如果破坏了平衡性,那么树本身会产生分裂和合并,然后调整结构以维持平衡性,这一点和AVL树为了保持平衡而产生的节点旋转的作用一样,2-3树的插入分裂有几种情况如下 2-3树的删除 2-3树节点的删除也会破坏平衡性,同样树本身也会产生分裂和合并,如下: ? 总结 本篇文章,主要介绍了2-3树相关的知识,2-3树,2-3-4树以及B树都不是二叉树,但与二叉树的大致特点是类似的,它们是一种平衡的多路查找树,节点的孩子个数可以允许多于2个,虽然高度降低了,但编码相对复杂

    2.4K20发布于 2019-04-28
  • 来自专栏刷题笔记

    2-3 链表拼接 (20 分)

    本文链接:https://blog.csdn.net/shiliang97/article/details/101050371 2-3 链表拼接 (20 分) 本题要求实现一个合并两个有序链表的简单函数

    73540发布于 2019-11-08
  • 来自专栏python3

    2-3 选项卡控件

    2-3 选项卡控件 u本节学习目标: n了解选项卡控件的基本属性 n掌握如何设置选项卡控件的属性 n掌握统计页面选项卡控件页面基本信息 n掌握选项卡控件的功能操作控制 2-3-1 简介 在 Windows 一般选项卡在Windows操作系统中的表现样式如图2-3所示。 ? 图2-3 图片框控件的属性及方法 2-3-2 选项卡控件的基本属性 图片框控件是使用频度最高的控件,主要用以显示窗体文本信息。 其基本的属性和方法定义如表2-3所示: 属性 说明 MultiLine 指定是否可以显示多行选项卡。如果可以显示多行选项卡,该值应为 True,否则为 False。 使用这个集合可以添加和删除TabPage对象 表2-3 选项卡控件的属性 2-3-3 选项卡控件实践操作 1.

    2.3K10发布于 2020-01-07
  • 来自专栏python3

    2-3 T-SQL函数

    2-3 T-SQL函数 学习系统函数、行集函数和Ranking函数;重点掌握字符串函数、日期时间函数和数学函数的使用参数以及使用技巧 重点掌握用户定义的标量函数以及自定义函数的执行方法 掌握用户定义的内嵌表值函数以及与用户定义的标量函数的主要区别 我们首先运行一段SQL查询:select tno,name , salary From teacher,查询后的基本结构如图2-3所示。我们看见,分别有三位教师的薪水是一样高的。 图2-3 薪酬排序基本情况 图2-4 row_number函数排序 图2-5 row_number另一使用 我们可以使用Row_number函数来实现查询表中指定范围的记录,一般将其应用到Web应用程序的分页功能上

    2.2K10发布于 2020-01-08
  • 来自专栏音视频技术

    非线性声学回声消除技术

    非线性的声学回声消除问题,在实际声学系统里面非常普遍也非常棘手,到目前为止还没有特别有效的办法来解决。目前介绍非线性声学回声消除的公开文献也少之又少。 1.非线性声学回声 1.1 什么是非线性声学回声? 1.1.1 什么是非线性的声学回声 下面我们直接进入到第一个部分,什么是非线性的声学回声? 非线性声学回声产生的原因 非线性声学回声产生的原因,我一共列了两条原因。原因之一,声学器件的小型化与廉价化,这里所指的声学器件就是前面B里面提到的功率放大器和喇叭。 这就是声学器件小型化容易产生非线性失真的一个主要的原因。这里廉价化比较好理解了,就不多说了。 原因之二,就是声学结构设计的不合理。最典型的一个实例就是声学系统的隔振设计不合理。 非线性声学回声系统建模 继续回到前面的这个声学回声路径图。我们对这个模型进行了简化。

    2.5K30发布于 2020-11-10
  • 来自专栏音乐与健康

    我们为什么选择“声学神经调控”这条路?

    2024年哈佛大学医学院在《Nature Neuroscience》的研究证实,特定模式的声学信号能调节神经振荡同步性,且这种调节具有长期稳定性;2025年斯坦福大学医学院的临床数据更显示,声学干预的不良反应发生率比电 /磁刺激低82%——安全性与长效性,正是鲸倍尔选择声学神经调控路径的核心依据。 它是一种可以被建模、被量化、被反复验证的物理信号——这一认知早已是全球声学神经调控领域的共识。 骨声纹正是基于这些研究,捕捉与神经张力、应激水平、生理节律相关的声学特征集合。 让神经系统——用“频谱参数”被理解基于骨声纹这一精准观测窗口,我们构建了频率依赖的神经-声学传导模型(FD-NATM)。

    10100编辑于 2026-04-22
  • AI模型Perch助力生物声学保护濒危物种

    AI如何推动生物声学科学发展以拯救濒危物种某机构旗下的Perch新模型帮助保护主义者更快分析音频,从而保护从夏威夷旋蜜雀到珊瑚礁等濒危物种。 它能够解耦数千甚至数百万小时音频数据中的复杂声学场景。该模型用途广泛,能帮助回答多种不同类型的问题,从“有多少幼崽出生”到“给定区域内存在多少只动物”。 此外,Perch正在帮助某机构和某声学观测站为多个独特的澳大利亚物种构建分类器。例如,相关工具帮助发现了一个新的、难以捉摸的平原游荡鸟种群。 近期论文《寻找叫声:生物声学中的敏捷建模》表明,该方法在鸟类和珊瑚礁场景中均有效,能够在不到一小时内创建出高质量的分类器。 展望未来:生物声学的前景这些模型和方法共同助力最大化保护工作的影响力,为有意义的实地工作留出更多时间和资源。

    9000编辑于 2026-05-27
  • 来自专栏黄成甲

    声学相机:用“眼睛”看见声音的奥秘

    测量中同步记录设备的可见光图像,以其为背景,通过几何配准将声场分布彩色等高线云图与可见光图像叠加显示,获得声学成像结果。声学成像结果中直观显示了声源空间位置、强度和频谱等特征。 声学相机的“视觉”如何形成? 硬件基础:麦克风阵列的奥秘 说到声学相机的视觉形成,这里就不得不提到麦克风阵列设计。 智能城市:体育场球迷互动 声学相机在智能城市的体育场球迷互动与建筑声学优化中展现出多模态感知与精准溯源的核心能力。 技术升级方面,AI深度学习算法与声学相机深度融合,实现数据驱动的声学优化。 更值得期待的是,量子计算与生物声学模型的融合,或将开启跨物种声波通信的探索。 当前,声学可视化技术标准化进程亟待加速。

    2.3K12编辑于 2025-07-29
  • 来自专栏机器学习入门

    算法原理系列:2-3查找树

    结构缘由 首先,搞清楚2-3查找树为什么会出来,它要解决什么样的问题?假设我们对它的基本已经有所了解了。先给它来个简单的定义: 2-3查找树: 一种保持有序结构的查找树。 而2-3树就是为了规避上述问题而设计发明出来的模型。现在请思考该如何设计它呢? 这里我们从BST遇到的实际问题出发,提出设计指标,再去思考利用些潜在的性质来构建2-3树。 这部分内容,没有什么理论根据,而是我自己尝试去抓些字典的性质来构建,而2-3树的诞生过程并非真的如此,所以仅供参考。 构建2-3树 字典的两个主要操作为:查找和插入。 我就不卖关子了,直接给出2-3树的其中一个基本定义: 一棵2-3查找树或为一颗空树,或由以下节点组成: 2-节点:含有一个键和两条链接,左链接指向的2-3树中的键都小于该节点,右链接指向的2-3树中的键都大于该节点 3-节点:含有两个键和三条链接,左链接指向的2-3树中的键都小于该节点,中链接指向的2-3树中的键都位于该节点的两个键之间,右链接指向的2-3树中的键都大于该节点。 !!!

    1.2K20发布于 2019-05-26
  • 来自专栏静之森

    记录折腾路上用到的教程 自2-3开始

    netdata: Real-time performance monitoring

    74120编辑于 2021-12-28
领券