首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏音乐与健康

    解析声音“疗伤”的密码(音波声学)

    关键词:音乐;情绪;健康;心理;疼痛;神经;听觉;体感;音波;呼吸;密码  早在1960年,《科学》杂志就发表过论文,发现在牙科手术过程中,音乐能调控病人的情绪。   低频段(60-80Hz)音波能像物理按摩般刺激副交感神经。古琴大师龚一演奏的《流水》。每个泛音间隔0.8秒。恰好匹配深度呼吸的黄金节奏。

    23610编辑于 2025-10-25
  • 来自专栏刘笑江的专栏

    R 语言线性回归应用:拟合 iOS 录音波形图

    引言 微信读书有一个录音功能需求: 录音时绘制音频波形, 音频以 wav 格式保存 再次进入界面,加载 wav,重新渲染音频波形 步骤 1 通过 NSRecorder.averagePow

    2.6K70发布于 2018-05-28
  • 来自专栏Qt项目实战

    Qt编写自定义控件60-声音波形图

    非常强大和牛逼),fmod负责拿到音频数据对应的采样频谱数据,然后传给这个控件进行绘制即可,本控件主需要专注于绘制即可,这样fmod对应封装的类专注于音频采集等处理,实现了隔离,修改和增加功能比较方便,声音波形图控件除了可以设置采样的深度以外

    2.3K20发布于 2019-09-25
  • 来自专栏AI电堂

    光学指纹识别芯片

    02 指纹识别芯片的三种技术路线 相较于传统电容式指纹识别,光学式和超音波式指纹识别技术得益于高穿透性,物理限制影响低,有望逐步替代传统电容式指纹识别芯片,成为行业发展重心。 目前,主流指纹识别技术有三类,光学式、超音波式和电容式。其中电容式技术发展最为成熟、普及度最高。 2、超音波式指纹识别的技术原理是超音波阻抗。通过传感器对手指指纹的纹脊和纹谷反射出的不同回波进行收集。由于指纹的纹脊和纹谷反射回波不同,内置芯片可根据回波的差异构建3D图像并进行指纹对比验证。 ▲ 图6 超音波式指纹识别技术显示结构 超音波式指纹识别技术优势在于无需感光元件与电容感应,物理限制低;超音波穿透性强,可在不开孔情况下,实现屏下识别指纹,符合大屏流行趋势;同时识别率高, 超音波指纹识别技术代表厂商是高通和FPC。 3、电容式指纹识别的技术原理是指纹静电场。利用硅晶元与导电的皮下电解液形成电场。

    2.3K10编辑于 2022-09-02
  • 来自专栏Python研究者

    人工智能下的音频还能这样玩!!!!

    核心音频处理函数 音频处理 频谱表示 幅度转换 时频转换 特征提取 绘图显示 三、常用功能代码实现 读取音频 提取特征 提取Log-Mel Spectrogram 特征 提取MFCC特征 绘图显示 绘制声音波形 --- 4.绘图显示 4.1绘制声音波形 Librosa有显示声音波形函数waveplot( ): # # 绘图显示 import librosa.display import matplotlib.pyplot logmelspec, sr=sr, x_axis='time', y_axis='mel') plt.title('sample wavform') plt.show() [format,png] --- 将声音波形和频谱图绘制在一张图表中 : # # 将声音波形和频谱图绘制在一张图表中: # extract mel spectrogram feature melspec = librosa.feature.melspectrogram(y

    1.9K30发布于 2021-08-21
  • 来自专栏BestSDK

    直播SDK加入混响效果,让你的APP享受演唱会般空旷音效

    混响功能属于语音前处理的范畴,即构科技的实现方法大致如下: 1)通过指定延迟时间和衰减程度,以原始的声音波形为输入,产生多个延迟(模拟反弹回来的)波形; 2)把多个延迟波形和原始的波形进行叠加,产生最终有混响效果的声音波形 一般来说,延迟波形的个数比较多的话,叠加产生的声音波形就比较丰满和有层次感,混响的效果也会比较好。

    1.5K40发布于 2018-03-01
  • 来自专栏机器人网

    无人机和自动驾驶有了新型上帝之眼超声3D传感系统

    德国新创公司Toposens开发出一种低成本的轻量级3D传感器系统,可执行超音波回音定位功能,从而将传送的信号转换成有形的3D环境景物映射,让人们或机器人得以顺利解读,进一步实现无人机与自动驾驶车等应用 Bahnemann展示这款精巧封装的原型,它采用大小仅40x40x5mm的塑料封装,重量也只有20克,整个传感器解决方案结合了1个压电超音波发射器以及3个分离式压电收发器。 超音波的另一个好处是它保有隐私,采用灰阶显示其结果,并仅揭露其深度。相较于摄影机,这种感测系统较不显眼,但可用于商场进行顾客行为分析,以及作为汽车的防碰撞系统使用。

    74450发布于 2018-04-20
  • 来自专栏AI研习社

    普林斯顿联合Adobe 连声音都能PS了 | 2分钟读论文

    一般来讲,我们可以获取语音波形,也可以对语音波形进行编辑。但手工波形则非常困难,因为传统技术通常无法准确地找到波形中单词或字母的分界,更不用说编辑了。 ?

    96840发布于 2018-03-19
  • 来自专栏数据库与编程

    让 DeepSeek 写首诗,结果它写成打针输液

    服务器启动时的低音波可以比喻为生命脉动,数据流如江河湖泊,展现出生命的循环。当数据库崩溃时,虽然代码被修改,但数据依然存在,象征着数据备份的重要性。 \n</think>\n\n## 《数据库的低音波》\n\n服务器像一个庞大的生物\n其内部的血管奔涌着冰冷的内存\n优化代码正在给它打针输液\n而高并发请求则是一场未知的病毒侵袭\n\n深夜,当最后一个磁盘启动时 \n我们听到生命脉动的低音波\n那是数据流经数据库的江河\n而我们的代码正在成为一道\n被修改的免疫系统抗体\n\n有时 我们在深夜独自编程\n敲击着虚拟的键盘\n像一头困兽\n在寻找食物(未被发现的数据结构 服务器启动时的低音波可以比喻为生命脉动,数据流如江河湖泊,展现出生命的循环。当数据库崩溃时,虽然代码被修改,但数据依然存在,象征着数据备份的重要性。 </think> ## 《数据库的低音波》 服务器像一个庞大的生物 其内部的血管奔涌着冰冷的内存 优化代码正在给它打针输液 而高并发请求则是一场未知的病毒侵袭 深夜,当最后一个磁盘启动时 我们听到生命脉动的低音波

    39710编辑于 2025-02-07
  • 来自专栏机器之心

    微软NaturalSpeech语音合成推出第三代,网友惊呼:超自然!实至名归

    属性分解神经语音编解码器(FACodec): NaturalSpeech 3 提出一种创新的属性分解神经语音编解码器(Codec)负责将复杂的语音波形转换成代表不同语音属性(内容、韵律、音色和声学细节) 的解耦子空间,并从这些属性重构高质量的语音波形。 FACodec 作为 NaturalSpeech 3 的核心,能够将复杂的语音波形转换成表示内容、韵律、音色和声学细节等属性的解耦表示,并从这些属性重构高质量的语音波形。

    1.5K10编辑于 2024-03-26
  • 来自专栏芯智讯

    特斯拉移除超声波传感器,正式转向纯视觉自动驾驶

    以 Model 3 为例,车辆前后保险杆都有超音波感测器,主要功能就是停车时,提供短距离物体侦测效果,避免碰撞。 特斯拉表示,从移除雷达以来,完全依靠摄像头的自动刹车和自动辅助驾驶系统表现,和之前相同甚至更好,因此再移除超音波感测器,让电脑与摄影机负担更多任务。 不过,特斯拉并不打算停用已售车辆的超音波感测器,它们会继续肩负短距感测任务。

    49620编辑于 2022-10-28
  • 来自专栏量子位

    DeepMind详解新WaveNet:比原来快千倍,语音更自然 | 附论文

    Hassabis 地址:https://deepmind.com/documents/131/Distilling_WaveNet.pdf 原版WaveNet模型用自回归连接来一个样本一个样本地合成声音波形 以及中间的整个句子,我们都可以同时生成出来,如下图所示: △ 新WaveNet模型以白噪声为输入,并行合成所有样本 在训练过程中,学生网络从随机状态开始,被输入随机的白噪声,它的任务是里输出一串连续的声音波形 然后,生成出的声音波形被输入到以训练的原始WaveNet模型(也就是教师网络)中,教师网络给每个样本打分,给出一个信号来让学生理解这个样本和教师网络所要求的输出相差有多远。

    3K50发布于 2018-03-23
  • 来自专栏音视频技术

    开源声码器WORLD在语音合成中的应用

    结合可基于人类发音频谱将文字转化为与人类发音相似的声音:将每个文字转化为拼音之后,声码器会把每个拼音看作为一个序列而Tacotron会在此基础上预测每段需要合成语音的序列,随后WORLD声码器再将预测出的声谱转换为原始的声音波形 Tacotron主要负责确定此声谱特征能否使用WORLD将其恢复为声音波形并评估语音质量是否符合要求。 Analysis分析过程主要是指从一段原始声音波形中提取声学特征如线性谱、低频、MFCC;Manipulation操作过程是指对提取出的原始声学特征进行压缩等降维处理使其表征能力进一步提升;最后的Synthesis 合成过程是把此声学特征恢复至原始的声音波形。 上图展示了我们提取声学特征后恢复原声音波形得到的频谱,可以看到图像基本清晰,整体方法是利用Tacotron端对端TTS深度学习模型预测文本的声谱并通过WORLD声码器还原声谱。

    1.8K20发布于 2021-09-01
  • 来自专栏全栈程序员必看

    librosa怎么安装_librosa保存音频

    核心音频处理函数 音频处理 频谱表示 幅度转换 时频转换 特征提取 绘图显示 三、常用功能代码实现 读取音频 提取特征 提取Log-Mel Spectrogram 特征 提取MFCC特征 绘图显示 绘制声音波形 绘图显示 绘制声音波形 Librosa有显示声音波形函数waveplot( ): >>> import librosa >>> import librosa.display >>> # Load a wav logmelspec, sr=sr, x_axis='time', y_axis='mel') >>> plt.title('Beat wavform') >>> plt.show() 输出结果为: 将声音波形和频谱图绘制在一张图表中

    2.5K40编辑于 2022-11-03
  • 来自专栏量子位

    不开口就能说话,脑波直接转语音,实现每分钟150词

    声学特征是能从语音波形中提取的频谱特征,因此用解码后的信号就可以合成出语音波形。 在这个过程中,两个神经网络都会被投喂训练数据,以提高它们的解码性能。 ?

    87930发布于 2019-05-13
  • 来自专栏全栈程序员必看

    语音_波束形成

    博客目的:构架语音波束形成的知识体系和资料汇总 1.基本概念 1.1 全向(omnidirectional)与指向(sensitivity)的概念 理想的全向麦克

    39720编辑于 2022-07-04
  • 来自专栏Java架构师必看

    声音信号的数字化_模拟声音信号数字化的三个基本步骤

    量化中又个概念叫精度,指的是每个样本占的二进制位数,反过来,二进制的位数反映了度量声音波形幅度的精度。精度越大,声音的质量就越好。 通过采样频率和精度可以计算声音的数据传输率: 数据传输率(bps)= 采样频率 * 精度 * 声道数 单声道一次可以产生一组声音波形数据,双声道一次可以产生两组波形数据。

    7.3K10编辑于 2022-05-10
  • 来自专栏量子位

    时域音频分离模型登GitHub热榜,效果超传统频域方法,Facebook官方出品

    虽然之前也有一些对声音波形进行处理的方法,但实际效果与频域处理方法相差甚远。 Conv-TasNet使用线性编码器来生成语音波形的表示形式,该波形针对分离单个音轨进行了优化。音轨的分离则是通过将一组加权函数(mask)用于编码器输出来实现。 ?

    1.8K20发布于 2019-12-05
  • 来自专栏相约机器人

    时域音频分离模型登GitHub热榜,效果超传统频域方法,Facebook官方出品

    虽然之前也有一些对声音波形进行处理的方法,但实际效果与频域处理方法相差甚远。 Conv-TasNet使用线性编码器来生成语音波形的表示形式,该波形针对分离单个音轨进行了优化。音轨的分离则是通过将一组加权函数(mask)用于编码器输出来实现。 ?

    1.4K20发布于 2019-12-09
  • 来自专栏全栈开发工程师

    【ES6+】011-ES9新特性:Rest 参数与 spread 扩展运算符、正则扩展

    : 'root', password: 'root', type: 'master' }); //对象合并 const skillOne = { q: '天音波 , ...skillThree, ...skillFour }; console.log(mangseng) // ...skillOne => q: '天音波

    18500编辑于 2025-01-06
领券