搜索 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

来自专栏音乐与健康
解析声音“疗伤”的密码（音波声学）
关键词：音乐；情绪；健康；心理；疼痛；神经；听觉；体感；音波；呼吸；密码　　早在1960年，《科学》杂志就发表过论文，发现在牙科手术过程中，音乐能调控病人的情绪。　　他们往往是早8点半之前到，晚上10点以后才离开。　　研究人员首先给爪子发炎的小鼠播放3种不同类型的声音，分别是舒缓的音乐、不协调的音符及白噪音。低频段（60-80Hz）音波能像物理按摩般刺激副交感神经。古琴大师龚一演奏的《流水》。每个泛音间隔0.8秒。恰好匹配深度呼吸的黄金节奏。
37410编辑于 2025-10-25
来自专栏刘笑江的专栏
R 语言线性回归应用：拟合 iOS 录音波形图
引言微信读书有一个录音功能需求：录音时绘制音频波形，音频以 wav 格式保存再次进入界面，加载 wav，重新渲染音频波形步骤 1 通过 NSRecorder.averagePow
2.7K70发布于 2018-05-28
来自专栏Qt项目实战
Qt编写自定义控件60-声音波形图
非常强大和牛逼），fmod负责拿到音频数据对应的采样频谱数据，然后传给这个控件进行绘制即可，本控件主需要专注于绘制即可，这样fmod对应封装的类专注于音频采集等处理，实现了隔离，修改和增加功能比较方便，声音波形图控件除了可以设置采样的深度以外
2.4K20发布于 2019-09-25
来自专栏AI电堂
光学指纹识别芯片
目前，主流指纹识别技术有三类，光学式、超音波式和电容式。其中电容式技术发展最为成熟、普及度最高。 2、超音波式指纹识别的技术原理是超音波阻抗。通过传感器对手指指纹的纹脊和纹谷反射出的不同回波进行收集。由于指纹的纹脊和纹谷反射回波不同，内置芯片可根据回波的差异构建3D图像并进行指纹对比验证。 ▲ 图6 超音波式指纹识别技术显示结构超音波式指纹识别技术优势在于无需感光元件与电容感应，物理限制低；超音波穿透性强，可在不开孔情况下，实现屏下识别指纹，符合大屏流行趋势；同时识别率高，超音波指纹识别技术代表厂商是高通和FPC。 3、电容式指纹识别的技术原理是指纹静电场。利用硅晶元与导电的皮下电解液形成电场。 ▲ 图8 汇顶第二、三代光学指纹识别方案实用示意图 ▲ 图9 汇顶三代屏下光学指纹识别方案对比面对 5G 智能手机对内部更大空间的需求，汇顶第三代超薄光学屏下指纹识别技术采用微透镜方案
2.5K10编辑于 2022-09-02
来自专栏Python研究者
人工智能下的音频还能这样玩！！！！
核心音频处理函数音频处理频谱表示幅度转换时频转换特征提取绘图显示三、常用功能代码实现读取音频提取特征提取Log-Mel Spectrogram 特征提取MFCC特征绘图显示绘制声音波形 --- 4.绘图显示 4.1绘制声音波形 Librosa有显示声音波形函数waveplot( )： # # 绘图显示 import librosa.display import matplotlib.pyplot logmelspec, sr=sr, x_axis='time', y_axis='mel') plt.title('sample wavform') plt.show() [format,png] --- 将声音波形和频谱图绘制在一张图表中： # # 将声音波形和频谱图绘制在一张图表中： # extract mel spectrogram feature melspec = librosa.feature.melspectrogram(y
2.1K30发布于 2021-08-21
来自专栏BestSDK
直播SDK加入混响效果，让你的APP享受演唱会般空旷音效
混响功能属于语音前处理的范畴，即构科技的实现方法大致如下： 1）通过指定延迟时间和衰减程度，以原始的声音波形为输入，产生多个延迟（模拟反弹回来的）波形； 2）把多个延迟波形和原始的波形进行叠加，产生最终有混响效果的声音波形一般来说，延迟波形的个数比较多的话，叠加产生的声音波形就比较丰满和有层次感，混响的效果也会比较好。
1.6K40发布于 2018-03-01
来自专栏Java架构师必看
声音信号的数字化_模拟声音信号数字化的三个基本步骤
量化中又个概念叫精度，指的是每个样本占的二进制位数，反过来，二进制的位数反映了度量声音波形幅度的精度。精度越大，声音的质量就越好。通常的精度有8bit，16bit，32bit等，当然质量越好，需要的储存空间就越大。通过采样频率和精度可以计算声音的数据传输率：数据传输率（bps）= 采样频率 * 精度 * 声道数单声道一次可以产生一组声音波形数据，双声道一次可以产生两组波形数据。有了数据传输率我们就可以计算声音信号的数据量数据量（byte）= 数据传输率 * 持续时间 / 8 例题： CD唱片上所存储的立体声高保真音乐的采样频率为44.1kHZ，量化精度为16位，双声道，计算一小时的数据量：根据公式： 44.1kHZ * 16bit * 2 * 3600s /8 =6350400B ≈ 605.6MB 看看这个数字，是非常大的了，所以，在编码的时候常常使用压缩的方式来减少储存空调提高传输效率
7.5K10编辑于 2022-05-10
来自专栏机器人网
无人机和自动驾驶有了新型上帝之眼超声3D传感系统
德国新创公司Toposens开发出一种低成本的轻量级3D传感器系统，可执行超音波回音定位功能，从而将传送的信号转换成有形的3D环境景物映射，让人们或机器人得以顺利解读，进一步实现无人机与自动驾驶车等应用 Bahnemann展示这款精巧封装的原型，它采用大小仅40x40x5mm的塑料封装，重量也只有20克，整个传感器解决方案结合了1个压电超音波发射器以及3个分离式压电收发器。超音波的另一个好处是它保有隐私，采用灰阶显示其结果，并仅揭露其深度。相较于摄影机，这种感测系统较不显眼，但可用于商场进行顾客行为分析，以及作为汽车的防碰撞系统使用。
76550发布于 2018-04-20
来自专栏AI研习社
普林斯顿联合Adobe 连声音都能PS了 | 2分钟读论文
一般来讲，我们可以获取语音波形，也可以对语音波形进行编辑。但手工波形则非常困难，因为传统技术通常无法准确地找到波形中单词或字母的分界，更不用说编辑了。 ?
1.1K40发布于 2018-03-19
来自专栏全栈开发工程师
【ES6+】011-ES9新特性：Rest 参数与 spread 扩展运算符、正则扩展
DOCTYPE html> <html> <head> <meta charset="utf-8"> <title>Rest参数与spread扩展运算符</title> </head> < : 'root', password: 'root', type: 'master' }); //对象合并 const skillOne = { q: '天音波 , ...skillThree, ...skillFour }; console.log(mangseng) // ...skillOne => q: '天音波 DOCTYPE html> <html> <head> <meta charset="utf-8"> <title>正则扩展：命名捕获分组</title> </head> <body> DOCTYPE html> <html> <head> <meta charset="utf-8"> <title>正则扩展：反向断言</title> </head> <body> <
23700编辑于 2025-01-06
来自专栏量子位
不开口就能说话，脑波直接转语音，实现每分钟150词
声学特征是能从语音波形中提取的频谱特征，因此用解码后的信号就可以合成出语音波形。在这个过程中，两个神经网络都会被投喂训练数据，以提高它们的解码性能。 ? 要知道已有的语音合成脑机接口每分钟只能生成 8 个单词，使用者也能用它们来表达自己的意思，但那远远称不上是“人类交流”。
94230发布于 2019-05-13
来自专栏数据库与编程
让 DeepSeek 写首诗，结果它写成打针输液
服务器启动时的低音波可以比喻为生命脉动，数据流如江河湖泊，展现出生命的循环。当数据库崩溃时，虽然代码被修改，但数据依然存在，象征着数据备份的重要性。 \n</think>\n\n## 《数据库的低音波》\n\n服务器像一个庞大的生物\n其内部的血管奔涌着冰冷的内存\n优化代码正在给它打针输液\n而高并发请求则是一场未知的病毒侵袭\n\n深夜，当最后一个磁盘启动时 \n我们听到生命脉动的低音波\n那是数据流经数据库的江河\n而我们的代码正在成为一道\n被修改的免疫系统抗体\n\n有时我们在深夜独自编程\n敲击着虚拟的键盘\n像一头困兽\n在寻找食物（未被发现的数据结构服务器启动时的低音波可以比喻为生命脉动，数据流如江河湖泊，展现出生命的循环。当数据库崩溃时，虽然代码被修改，但数据依然存在，象征着数据备份的重要性。 </think> ## 《数据库的低音波》服务器像一个庞大的生物其内部的血管奔涌着冰冷的内存优化代码正在给它打针输液而高并发请求则是一场未知的病毒侵袭深夜，当最后一个磁盘启动时我们听到生命脉动的低音波
52910编辑于 2025-02-07
来自专栏机器之心
微软NaturalSpeech语音合成推出第三代，网友惊呼：超自然！实至名归
属性分解神经语音编解码器（FACodec）: NaturalSpeech 3 提出一种创新的属性分解神经语音编解码器（Codec）负责将复杂的语音波形转换成代表不同语音属性（内容、韵律、音色和声学细节）的解耦子空间，并从这些属性重构高质量的语音波形。 FACodec 作为 NaturalSpeech 3 的核心，能够将复杂的语音波形转换成表示内容、韵律、音色和声学细节等属性的解耦表示，并从这些属性重构高质量的语音波形。
1.7K10编辑于 2024-03-26
来自专栏机器之心
微软NaturalSpeech 2来了，基于扩散模型的语音合成
考虑到语音波形的复杂性和高维度，微软亚洲研究院机器学习组与 Yoshua Bengio 共同提出的 Regeneration Learning 范式，为这个问题提供了创新的参考答案。图1：NaturalSpeech 2 系统概览 NaturalSpeech 2 首先利用神经语音编解码器（Neural Audio Codec，如图2所示）的编码器（encoder），将语音波形转换为连续向量并用解码器（decoder）重建语音波形，再运用潜在扩散模型（Latent Diffusion Model）以非自回归的方式从文本预测连续向量。离散 token 会导致序列长度过长（例如，使用8个残差向量量化器，序列长度会增加8倍），增加了预测的难度。而连续向量可以缩短序列长度，同时增加细粒度重建语音所需要的细节信息。 2. 与语音提示的韵律相似度比较表6：NaturalSpeech 2 的主观相似度评分 SMOS 结果在稳定度方面，相较于既有的 TTS 模型，NaturalSpeech 2 的表现也更为优异，如表7和表8所示
1.8K30编辑于 2023-05-16
来自专栏量子位
DeepMind详解新WaveNet：比原来快千倍，语音更自然 | 附论文
Hassabis 地址：https://deepmind.com/documents/131/Distilling_WaveNet.pdf 原版WaveNet模型用自回归连接来一个样本一个样本地合成声音波形以及中间的整个句子，我们都可以同时生成出来，如下图所示： △ 新WaveNet模型以白噪声为输入，并行合成所有样本在训练过程中，学生网络从随机状态开始，被输入随机的白噪声，它的任务是里输出一串连续的声音波形然后，生成出的声音波形被输入到以训练的原始WaveNet模型（也就是教师网络）中，教师网络给每个样本打分，给出一个信号来让学生理解这个样本和教师网络所要求的输出相差有多远。
3.1K50发布于 2018-03-23
来自专栏音视频技术
开源声码器WORLD在语音合成中的应用
结合可基于人类发音频谱将文字转化为与人类发音相似的声音：将每个文字转化为拼音之后，声码器会把每个拼音看作为一个序列而Tacotron会在此基础上预测每段需要合成语音的序列，随后WORLD声码器再将预测出的声谱转换为原始的声音波形 Tacotron主要负责确定此声谱特征能否使用WORLD将其恢复为声音波形并评估语音质量是否符合要求。 Analysis分析过程主要是指从一段原始声音波形中提取声学特征如线性谱、低频、MFCC；Manipulation操作过程是指对提取出的原始声学特征进行压缩等降维处理使其表征能力进一步提升；最后的Synthesis 合成过程是把此声学特征恢复至原始的声音波形。上图展示了我们提取声学特征后恢复原声音波形得到的频谱，可以看到图像基本清晰，整体方法是利用Tacotron端对端TTS深度学习模型预测文本的声谱并通过WORLD声码器还原声谱。
2K20发布于 2021-09-01
来自专栏全栈程序员必看
librosa怎么安装_librosa保存音频
核心音频处理函数音频处理频谱表示幅度转换时频转换特征提取绘图显示三、常用功能代码实现读取音频提取特征提取Log-Mel Spectrogram 特征提取MFCC特征绘图显示绘制声音波形绘图显示绘制声音波形 Librosa有显示声音波形函数waveplot( )： >>> import librosa >>> import librosa.display >>> # Load a wav logmelspec, sr=sr, x_axis='time', y_axis='mel') >>> plt.title('Beat wavform') >>> plt.show() 输出结果为：将声音波形和频谱图绘制在一张图表中
2.8K40编辑于 2022-11-03
来自专栏芯智讯
特斯拉移除超声波传感器，正式转向纯视觉自动驾驶
以 Model 3 为例，车辆前后保险杆都有超音波感测器，主要功能就是停车时，提供短距离物体侦测效果，避免碰撞。特斯拉表示，从移除雷达以来，完全依靠摄像头的自动刹车和自动辅助驾驶系统表现，和之前相同甚至更好，因此再移除超音波感测器，让电脑与摄影机负担更多任务。不过，特斯拉并不打算停用已售车辆的超音波感测器，它们会继续肩负短距感测任务。
57220编辑于 2022-10-28
来自专栏技术杂记
8
qdisc noqueue state UNKNOWN link/loopback 00:00:00:00:00:00 brd 00:00:00:00:00:00 inet 127.0.0.1/8
51341编辑于 2022-06-30
来自专栏技术杂记
8
在RFG比较失败的情况下会跳向对应_guard_ss_verify_failure：00007ff7`58e526e2 644c8b1c24 mov r11,qword ptr fs: _guard_ss_verify_failure_fptr 00007ffa`0495f970 00007ffa`238fe8c0 ntdll!
79441编辑于 2022-06-29

第 2 页第 3 页第 4 页第 5 页第 6 页第 7 页第 8 页第 9 页第 10 页第 11 页

点击加载更多

解析声音“疗伤”的密码（音波声学）

R 语言线性回归应用：拟合 iOS 录音波形图

Qt编写自定义控件60-声音波形图

光学指纹识别芯片

人工智能下的音频还能这样玩！！！！

直播SDK加入混响效果，让你的APP享受演唱会般空旷音效

声音信号的数字化_模拟声音信号数字化的三个基本步骤

无人机和自动驾驶有了新型上帝之眼超声3D传感系统

普林斯顿联合Adobe 连声音都能PS了 | 2分钟读论文

【ES6+】011-ES9新特性：Rest 参数与 spread 扩展运算符、正则扩展

不开口就能说话，脑波直接转语音，实现每分钟150词

让 DeepSeek 写首诗，结果它写成打针输液

微软NaturalSpeech语音合成推出第三代，网友惊呼：超自然！实至名归

微软NaturalSpeech 2来了，基于扩散模型的语音合成

DeepMind详解新WaveNet：比原来快千倍，语音更自然 | 附论文

开源声码器WORLD在语音合成中的应用

librosa怎么安装_librosa保存音频

特斯拉移除超声波传感器，正式转向纯视觉自动驾驶

8

8

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐