首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏关键帧Keyframe

    声音的表示(2):作为音视频开发,你真的了解声音吗?丨音视频基础

    这些符号代表将原音升高或降低半音,在十二平均律(现在最广泛使用的调音法)中则是将原频率乘或除以 2(1/12)=1.0594 倍,即升高 n 个半音就将原频率乘 2(n/12) 倍,降低 n 个半音则乘 2(-n/12) 倍。 ♯C2 17.32 D0 D1 D2 18.35 D♯0/E♭0 ♯D1 ♯D2 19.45 E0 E1 E2 20.6 F0 F1 F2 21.83 F♯0/G♭0 ♯F1 ♯F2 23.12 G0 G1 G2 24.5 G♯0/A♭0 ♯G1 ♯G2 25.96 A0 A1 A2 27.5 A♯0/B♭0 ♯A1 ♯A2 29.14 B0 B1 B2 30.87 C1 C C1 32.7 C♯1 这种复杂的波形可以分解为一系列的正弦波,这些正弦波中有基频 f0,它对应声音的基音,还有与 f0 成整数倍关系的谐波:f1、f2、f3、f4 等,它们对应声音的泛音,它们的振幅有特定的比例。

    1.8K40编辑于 2022-06-13
  • 【教程】免费 AIGCPanel➕CosyVoice 声音合成和声音克隆

    AIGCPanel和CosyVoice介绍AIGCPanel是一个功能强大的开源数字人软件,提供直观的用户界面,让用户能够轻松管理和使用各种声音AI模型和视频AI模型。 进入 AIGCPanel 的模型,点击右上角选择导入模型导入完成后,点击启动,等待模型启动完成声音克隆进入我的音色界面,上传被克隆的声音,注意声音保留5-10秒即可,太长的声音反而效果不好。 进入声音克隆界面,选择 CosyVoice 模型,选择被克隆的音色,输入克隆文字,点击提交。等待克隆完成,这时候就可以看到声音克隆的结果,直接点击可以播放。 声音合成进入声音合成界面,选择 CosyVoice 模型,选择需要合成音色,输入合成文字,点击提交。等待合成完成,这时候就可以看到声音合成的结果,直接点击可以播放。

    1.1K10编辑于 2025-07-18
  • 来自专栏MixLab科技+设计实验室

    声音,无限可能

    来自论文: Seeing Voices and Hearing Faces: Cross-modal biometric matching 类似于“相由心生”,声音也是和面相有相关性的。 声音和其他模态信息的关联度,或者互动,真的非常有意思~~ @知识库 shadow 知识库 来啦~~ 我们先从声音与健康说起~~ 国际期刊《柳叶刀》有一篇《通过你的声音能诊断疾病吗?》 关键技术是AI识别和处理人类的各种声音模式,包括音高、音调、节奏,呼吸轻缓、咳嗽等。这将极大改善医疗健康的服务模式,但在实践中仍需大量的数据验证。 VoiceWise 准确率高达95% 第一性原理:如果器官生病了,人的声音就会发生改变。 罗马Tor Vergata大学教授Giovanni Saggio开发了VoiceWise,该系统分析用户的声音,通过AI将6300个声音值与某些病理状态的声音值进行比较,从而诊断所患的病理。

    1.9K20发布于 2021-09-18
  • 来自专栏Helloted

    开发之声音

    部分代码位置Github-VoiceDemo Pre 与图片中默认的格式为PNG格式一样,iOS开发中声音的格式也有默认格式,为wav格式,本文中的产生的格式均为wav格式,其他格式则需要转换。 有第三方的框架,进行转换成amr等格式 一、声音录制 要先引入AVFoundation的框架 #import <AVFoundation/AVFoundation.h> self.voiceRecorder ,Path和Setting Path:声音文件录制后存储的路径 Setting:一个录制参数的字典,设置一些录制的必要的参数,需要进行调整到合适的值 _recorderSetting = AVAudioRecorder在录制的时候可以暂停和恢复 暂停 - (void)pause; /* pause recording */ 恢复/开始 - (void)record; 录制完成 - (void)stop; 二、声音播放 注意:如果在播上一段录音,同时再点播放的话,两个声音会一起播放 if (_player) { // 如果正在播放上一段录音,则停止 [_player stop]; }

    1.5K10编辑于 2022-06-07
  • 来自专栏linux运维

    系统声音问题:系统声音设置错误,影响使用

    2. 测试音频输出播放测试声音,确保音频设备正常工作。# 播放双声道测试声音speaker-test -c 2 -t wav如果没有声音输出,请检查音量设置或音频服务状态。3. 排查常见问题根据现象排查常见问题:无声音:检查是否选择了正确的输出设备,或是否有其他程序占用音频设备。音量异常:调整音量设置,确保未静音。爆音或杂音:尝试降低音量或更换音频线缆。9.

    1.5K10编辑于 2025-02-09
  • 来自专栏全栈程序员必看

    MacBook 屏幕录制 soundflower 只录内屏声音 无外界声音

    自带的QuickTimePlayer录制屏幕的时候(或者按快捷键⇧+⌘+5),只有三个选项: 1)无声音 2)选外置扬声器。 这里的“聚集设备”是输入,录屏时候想录入哪些声音,这里就选择相应的设备。“多输出设备”用于在录屏时候的自己想听到哪些声音,二者搭配使用(2ch搭配2ch,64ch搭配64ch)。 选择聚集设备和多输出设备后,不能调音量,要在使用电脑扬声器或者耳机的时候就把音量调好 只录制内屏声音(电脑发出的声音),不录制外屏声音(电脑麦克风或者耳机麦克风的收音),且录制的时候听不见内屏声音(不适用于我 ,我上网课的时候录屏,这个选择听不见网课老师的声音): 录制选择:option -> mircrophone 选择soundflower(2ch)/soundflower(64ch), 输出 :点小喇叭 选择soundflower(2ch)/soundflower(64ch) 只录制内屏声音,不录制外屏,且录制的时候能听见内屏声音(上网课录屏适用): 录制选择:option ->

    3.6K10编辑于 2022-08-15
  • 来自专栏码上就说

    关于声音采集和声音处理的一些建议

    相机录制的过程除了采集画面,还有采集音频数据的过程,我们今天就主要介绍一下声音采集的过程以及采集的声音是怎么处理的。 声音采集 声音采集是系统提供的接口采集环境声,AudioRecord就是Android平台上提供的采集声音的系统API。 在采集声音之前,需要设置声音的采样率和声道数,通常情况下采样率是44100Hz,声道数是2。 采用回来的声音是short数组。 我们知道声音有两个重要的属性:sample_rate(采样率)和channel(采样频道),声音的标准化就通过这两个决定,当我们编码和播放解码出来的音频数据时,就需要将声音的两个属性标准化一下,使得处理之后的音频能够正常的编码或者播放

    2K20编辑于 2022-05-25
  • 来自专栏全栈程序员必看

    OGEngine教程:声音载入

    以下介绍声音资源从载入到播放的一个流程 首先,我们将须要的音频文件放到assets文件夹下,OGE中SoundRes和MusicRes为我们封装了非常多经常使用的方法,能够用于载入及播放等经常使用功能 载入 //设置声音读取路径 Device.getDevice().getSoundFactory().setAssetBasePath(“mfx/”); SoundRes.loadSoundFromAssets

    1.7K30编辑于 2022-07-13
  • 来自专栏KT148A

    KT148A语音芯片的声音小,如何让喇叭声音变大?声音影响注意点

    客户反馈他们的产品,声音小,提供的信息如下:喇叭参数是8欧姆1W ,包括外壳的出音孔客户声音小是必然的,原因如下:喇叭的尺寸太小了,并且这个选用的喇叭肯定是“薄膜型”的喇叭外壳的发音孔是不对的,太少了这个的声音 ,估计只有手机外放声音的40%左右。 跟KT148A本身的驱动力,是没有任何关系的,哪怕增加功放,声音都大不了,反而容易烧喇叭解决的办法也没有太多,只能从喇叭和腔体两个方面去选择选择稍微尺寸大一点的喇叭,尽可能大一点,尽量选择“纸盆”结构的喇叭外壳的腔体 ,要多的出音孔==》这个我们资料包也有详细的文档描述,路径如下:这里我们多增加一些关于产品的图片示例供您参考一般玩具,声音挺大的,他们选择的喇叭如下:一般外壳的出音孔设计如下:总之:声音的大小是一个系统的工作 ,KT148A本身驱动声音的能力是很大的,达到200mA,通过电流也可以看出来。

    46300编辑于 2025-01-09
  • 来自专栏python3

    python 播放声音

    ("播放音乐1") track = pygame.mixer.music.load("tkzc.wav") pygame.mixer.music.play() print("播放音乐2" ) track1=pygame.mixer.music.load("xx.mp3") pygame.mixer.music.play() print("播放音乐3") track2= pygame.mixer.Sound("tkzc.wav") track2.play() 以下内容的链接地址为:http://stackoverflow.com/questions/260738 playsound import playsound playsound('/path/to/file.wav', block = False) import os os.popen2(

    1.6K20发布于 2020-01-08
  • 来自专栏达摩兵的技术空间

    聆听心灵的声音

    2 尽心。尽自己最大努力,尽所有可能,尽量从他人之心考虑,把任何其他人的事情当成自己的事情,这里不想太多,不同人到不同阶段考虑的周全程度不同,能得到的人脉帮助也是不同的,只要你尽己之力去做就好。 有些外向,声音好听,见多识广,会说话,善于微笑的人。有些特质确实是我们羡慕不来的,比如有些人就是方向感好,有些人就是数学超好,有的人英语很流利没有中国口音等。

    1.2K20发布于 2018-08-28
  • 来自专栏疯狂学习GIS

    让电脑播放手机的声音:不影响电脑自身声音

      本文介绍在Windows系统的电脑中,基于免费的Bluetooth Audio Receiver软件,实现用电脑播放手机声音,且与电脑自身声音不冲突同时播放的方法。    最近,需要将手机的声音投放至电脑播放,且希望电脑与手机的声音可以实现不冲突的同时播放——即二者不会出现“一个播放,另一个就要被自动暂停”的此消彼长的情况。 现在用手机开启音乐、视频等声音,就可以由电脑来播放啦;同时电脑还可以播放别的声音,做到二者互不冲突。如果出现声音比较小的情况,可以调整手机音量或电脑音量。

    5.6K10编辑于 2024-08-05
  • 来自专栏CreateAMind

    声音图片 多感知论文

    In this work, we show that a model trained to predict held-out sound from video frames learns a visual representation that conveys semantically meaningful information. We formulate our sound-prediction task as a classification problem, in which we train a convolutional neural network (CNN) to predict a statistical summary of the sound that occurred at the time a video frame was recorded.

    76220发布于 2018-08-20
  • 来自专栏Fdu弟中弟

    HTML人工合成声音

    问答系统中可以使用的人工合成声音。 <! step="0.1"> <label for="pitch">Pitch:</label> <input name="pitch" type="range" min="0" max="<em>2</em>"

    1.1K20发布于 2021-02-24
  • 来自专栏鹅厂网事

    OFC上的腾讯声音

    注1:凡注明来自“鹅厂网事”的文字和图片等作品,版权均属于“深圳市腾讯计算机系统有限公司”所有,未经官方授权,不得使用,如有违反,一经查实,将保留追究权利; 注2:本文图片部分来至互联网,如涉及相关版权问题

    1.6K50发布于 2018-04-27
  • 来自专栏全栈程序员必看

    Macbook OBS 录制系统声音

    安装好OBS软件 下载并安装soundflower软件,也可以在GitHub中下载 打开midi音频设置 构建多输出设备 例如,我现在是带着外置耳机,并且录制系统声音,那么多输出设备就勾选这两个 配置完成后,我们可以右键选择该设备用于声音输出 发布者:全栈程序员栈长,转载请注明出处:https://javaforall.cn/140636.html原文链接:https://javaforall.cn

    1.6K30编辑于 2022-09-01
  • 来自专栏python3

    Python声音处理入门

    Python声音处理入门 注:本文加入了译者的理解,并非严谨的译作,仅供参考。 ---- 原文Basic Sound Processing with Python描述了怎样在Python中通过pylab接口对声音进行基本的处理。 我们把声压值归一化,即映射到区间[-1, 1): snd = snd / (2.**15) 查看wav文件的通道数和采样点数 >>> snd.shape (5060, 2) 表示文件包含2个通道,5060 ,假如你想在python中回放声音,参考pyalsaaudio(Linux)或PyAudio。 用函数fft对声音进行快速傅立叶变换(FFT),得到声音的频谱。

    2.3K41发布于 2020-01-10
  • 来自专栏码客

    Android声音和亮度设置

    声音设置 调整手机的各种音量可以通过AudioManager这个类来操作 注:安卓手机各种音量的最大数值不一样,请通过下面具体的方法获取最大音量值。 STREAM_DTMF 双音多频 不过三方的Rom中 这些类型可能是多对一的 也就是 多种类型调节的是同一种 flags参数:(下面是常用的几个) FLAG_PLAY_SOUND 调整音量时播放声音 int streamType, int direction, int flags)方法也可用来调整音量, 只不过不能设置具体数值,根据系统的阀值来自动调整,其中第1和第3个参数上面有说明, 下面是第2个参数的介绍

    2.5K20发布于 2019-10-22
  • 来自专栏码客

    iOS后台播放声音

    Info项添加如下 Required background modes 类型为 Array 添加子项App plays audio or streams audio/video using AirPlay 2.

    2.2K10发布于 2019-10-22
  • 来自专栏腾讯云音视频专家服务

    IOS播放音频编码AAC_HE_V2声音,如何解决?

    前言 最近一些客户遇到,mp4格式的视频文件,在浏览器播放有声音,但在ios播放无声音。还有这种情况? 但是两个声道的声音存在某种相似性,根据香农信息熵编码定理,相关性应该被去掉才能减小文件大小。所以PS技术存储了一个声道的全部信息,然后,花很少的字节用参数描述另一个声道和它不同的地方。 HE-AAC v2编码格式。 如下图为iPhone 6 - 技术规格中支持的声音文件格式,不支持HE-AAC v2格式: image.png 下图iPhone 7 - 技术规格中支持的声音文件格式,支持HE-AAC v2格式: image.png 好吧,兼容性问题,播放无声音的原因终于找到了。 参考:https://www.cnblogs.com/bhlsheji/p/5266638.html 解决方案 那我们如何解决呢?

    5.6K233发布于 2020-11-06
领券