搜索 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

来自专栏全栈之路
游戏优化之音频压缩
其实这个比较容易忽略掉，但是音频资源如果不压缩的话，可能会造成游戏加载速度慢，尤其是对于一些音频资源依赖较高的游戏。来看一下效果： ? 好了，其实这里要介绍的是一条命令，它依赖于ffmpeg。具体如下： ffmpeg -i ${f} -vn -ar 22050 -ac 1 -ab 128 -f mp3 ${dst} 其中$f为源文件，$dst为目标文件接下来介绍一下mac上的音频压缩脚本， ~" 用法，格式将输出为mp3格式： audio.sh -s <音频源目录> -d <音频资源目录>
1.6K30发布于 2018-10-19
来自专栏音视频开发技术
FFmpeg编解码处理4-音频编码
音频编码的步骤：初始化打开输出文件时构建编码器上下文音频帧编码 1) 将滤镜输出的音频帧写入音频fifo 2) 按音频编码器中要求的音频帧尺寸从音频fifo中取出音频帧 3) 为音频帧生成 pts 4) 将音频帧送入编码器，从编码器取出编码帧 5) 更新编码帧流索引 6) 将帧中时间参数按输出封装格式的时间基进行转换 6.1 打开视频编码器完整源码在open_output_file 比如，AAC音频格式转MP2音频格式，AAC格式音频帧尺寸为1024，而MP2音频编码器要求音频帧尺寸为1152，编码会失败；再比如AAC格式转码AAC格式，某些AAC音频帧为2048，而此时若AAC音频编码器要求音频帧尺寸为使用音频fifo，从而保证每次送入编码器的音频帧尺寸满足编码器要求 // 3.1 将音频帧写入fifo，音频帧尺寸是解码格式中音频帧尺寸 if (! AV_LOG_INFO, "read aframe from fifo error\n"); goto end; } // 4.
2.4K30发布于 2019-04-01
AI处理文字、图片、PPT、音频、视频
在AI技术快速发展的今天，各类大模型与智能工具层出不穷，其能力各有侧重，都在不断迭代更新。选择工具的关键，在于明确自己的核心需求场景。 AI 创作工具，擅长短视频与图文创意生成；风格贴合抖音生态，支持快速出片，免费版有功能限制内容创作悠船专注于内容创作辅助，支持文案生成、创意构思、内容优化；适配自媒体、营销场景，操作便捷，部分功能需付费智能体开发 4.KimiPPT 生成效率高、排版美观，多模态内容整合能力强；非会员生成速度慢，高级功能需付费。 16.即梦字节系 AI 创作工具，擅长短视频与图文创意生成；风格贴合抖音生态，支持快速出片，免费版有功能限制。 17.扣子（Coze）低代码搭建专属 AI 智能体，无需深厚编程基础；内置丰富插件与知识库，支持自定义对话流程；因为没有数据库，数据是直接写死的。总结而言，AI工具的选择并非“一刀切”。
71910编辑于 2026-01-12
来自专栏音视频技术
音频正当时：我们和声网音频专家聊了聊AI、元宇宙、空间音频和“沉浸感”
近日，LiveVideoStack采访到了声网的音频算法负责人冯建元，请他来跟大家聊聊音频相对于视频的优势、音频在元宇宙中的应用、国内音频技术与AI结合的发展、过去一年声网在音频领域所取得突破和对前沿音频技术的探索我关注的音频领域还是比较多的，从基于AI的语音编解码器、空间音频到声纹变声等都有在关注和尝试。 LiveVideoStack: 目前AI与音频技术的结合已经成为一种趋势，比如AI技术常用于音频降噪、回声消除和音频特效等。除此之外，AI和音频的技术结合还有哪些新的探索？实时变声，甚至空间音频中的个性化HRTF都可以用AI模型生成，可以说AI几乎已经融入到了音频的每一个角落。冯建元：我觉得国内在AI与音频技术结合上已经是国际第一流的水平，尤其在严肃、传统的3A处理领域。在音乐、AI Codec等比较新的领域，我们则可能处于平分秋色或者在前沿探索方面略显滞后。
77620编辑于 2022-04-19
来自专栏河湾欢儿的专栏
4.页面优化
为什么要优化？优化的好处 1.提升网页响应速度 2.有利于搜索引擎搜索 3.对后期维护比较方便怎么优化？ 1.减少请求 2.减少文件的大小 3.页面性能 4.可读性、维护性 1.图片合并 2.css文件合并（多个css文件合并为一个、少量的行内样式、避免import的方式引入文件） 3.减少图片的大小（选择合适的图片格式） 4.css值缩写 5.0px 中px省略 0% 0 0.5可以写成.5 6.选择器合并 7.link标签引入样式放到head标签中 8.js脚本建议放在底部，等页面加载完之后再处理尽量用语义化的标签来编写，有利于seo 15.类型和id名，以内容语义来命名 16.避免hack 17.模块化（一系列相关的结构做成一个模块来处理） 18.必要的时候添加注释，可读性比较好比如说代码优化，大家试着说一下怎么优化？
51220发布于 2018-09-06
来自专栏猫头虎AI技术分享
快速上手 AI ：AI 视频与音频生成教程
快速上手 AI ：AI 视频与音频生成教程摘要：随着生成式AI的爆发式发展，音视频创作已经从“专业技能”转变为“人人可用”的智能工具。无论你是开发者、内容创作者，还是新媒体运营者，通过AI生成视频和音频，都能显著提升效率与创意质量。本文将从==AI音频生成、AI视频生成、工具对比、应用实例==四大方向带你快速上手，并附带一键上手代码与流程图可视化讲解。 AI音频：支持多语言、多音色的语音克隆、音乐生成、背景音合成等。 ", voice="alloy", input="欢迎收看AI视频与音频生成教程！")
4.4K351编辑于 2025-10-06
来自专栏技术杂记
Mysql 优化存储4
优化脚本一般此过程会非常漫长，可以写一个脚本来后台运行，或简单的控制一下IO [hunter@opti-slave ~]$ cat opti.bash #! opti.bash >> /path/to/optimize.log 2>&1 & 通过监控 optimize.log 来判断执行完成状态也可以通过查看监控，IOPS很能反映问题 ---- 恢复备份优化完成后，立刻恢复备份 start slave; 通过对比前后数据文件大小，可以明显看到优化效果一般少也能缩减5%的空间，平均在10%左右，我自己经历最明显效果的是减少了32%的空间，对于一个大库来说，能节省不少磁盘空间，并且对查询性能也有一定优化效果 ---- 命令汇总 pt-table-checksum --nocheck-replication-filters --nocheck-binlog-format --
41620编辑于 2022-03-21
来自专栏Java 汇总
4.Mysql 优化
1.ORDER BY的优化某些情况下，MySQL使用索引排序，尽量避免使用 filesort 即使ORDER BY与索引不完全匹配，也可以使用索引，只要索引的未使用部分和额外的如果是这样，优化器可能不使用索引。如果SELECT*只选择索引列，则使用索引并避免排序。 * FROM t1 WHERE key_part1 = constantORDER BY key_part2; ---- 假设 key_part1不是索引或索引的一部分，在条件中作为常量条件存在，则优化器也会使用索引为了获得文件排序操作的内存，从MySQL8.0.12开始，优化器会根据需要递增地分配内存缓冲区，直到达到sort_buffer_size系统变量指定的大小，而不是像MySQL8.0.12之前那样预先分配固定数量的
1K20发布于 2020-10-29
来自专栏Dance with GenAI
用AI将m4b格式音频批量转换为mp3格式
Deepseek中输入提示词：写一个m4b格式文件（带有章节的 AAC 编码的音频文件）转换为mp3格式的Python脚本，具体步骤如下：用户输入m4b格式音频的文件地址，比如："F:\有声英文书\ Life 3.0 Being Human in the Age of Artificial Intelligence (Unabridged).m4b" 接受这个文件地址，然后将其转换为mp3格式的音频；新建一个子文件夹，文件名名称为m4b格式音频的主文件名；读取m4b格式音频中的章节信息，将这个mp3文件按照m4b格式音频中的章节分割成多个mp3音频，保存在刚才新建的子文件夹中；如果m4b格式音频中没有章节信息，就按照每段1个小时时长将这个mp3文件分割；注意：每一步都要输出信息到屏幕上如果用户输入的不是m4b格式音频，而是mp3音频文件，就跳过转换步骤，直接按照每段1个小时时长将其分割； Deepseek 依赖库： ffmpeg-python：用于调用 ffmpeg 进行音频处理。 mutagen：用于读取 m4b 文件中的章节信息。
70800编辑于 2025-01-15
来自专栏量子位
只有音频没指纹，能抓对人吗？CMU音频分析AI说没问题
然鹅，现在有了AI，音频分析技术已经到了前所未有的高度。 Rita Singh，是这一领域的顶尖科学家，工作于卡内基·梅隆大学的语言技术研究所。 Singh和她卡耐基梅隆的同事所研发的这套音频分析技术，可以找出人都听不出来的细微差别。她们可以把音频切成毫秒的片段，然后用AI技术来梳理处理这些片段以寻找独特的标识。当你说话的时候，AI可以猜出你所在房间的大小，房间是否有窗户，墙体是什么材质的。更不可思议的是，AI还可以根据当地电网的电压波动，判断出打电话的人的物理位置，以及是一天当中什么时间段打出的电话。 AI技术的引入，对于那些总是爱报假警的人来说是个坏消息。要知道，在美国报假警触犯了联邦法律，处罚很重而且还要进去蹲好几年。 Singh的技术大大减少了这类事件的发生，还快速准确地锁定了罪犯。 AI技术的发展速度都是指数级别的，可以预见到未来，音频分析将会用于法律定罪以外的领域。
82590发布于 2018-03-22
来自专栏转载gongluck的CSDN博客
FFmpeg菜鸡互啄#第4篇#音频解码
解码过程音频解码跟上一篇的视频解码过程是一样的：打开输入文件，查找音频流，打开解码器，循环读帧解码帧，关闭解码器，关闭输入文件。 //但是出于优化等方面的考虑，linesize[0]实际上并不等于宽度width，而是一个比宽度大一些的值。 if (avcodec_decode_audio4(pACodecCtx, &Frame, &got_picture, &packet) < 0) { AV_SAMPLE_FMT_FLTP) { for (int i = 0; i < Frame.linesize[0]; i += 4) avformat_free_context(pFormatCtx);就不需要了 return 0; } 保存的音频PCM可以用Audacity进行播放。
1.4K60发布于 2018-03-08
来自专栏mathor
枚举+优化（4）——哈希表优化实例2
例3.四平方和思路1：枚举abcd，判断a^2^+b^2^+c^2^+d^2^是否等于N 分析规模 a：0 ~ sqrt(500000 / 4) b：0 ~ sqrt(500000 / 3 font color = red>经验：1秒=10^8^ 思路2：枚举abc，判断N-a^2^-b^2^-c^2^是不是完全平方数分析规模 a：0 ~ sqrt(500000 / 4) * d) == f.end()) f[c * c + d * d] = c; //枚举a，b的值 for(int a = 0;a * a <= n / 4; << c << " " << d << endl; return 0; } } } return 0; } 例4. ; return 0; } 第一次作业先说说的思路，当时看到这题有点懵，可能还是对哈希算法掌握的不够，怎么都想不到用哈希的方法去做，索性先写了个O(N^2^)的两重循环，想着这几天学的优化
82950发布于 2018-06-08
来自专栏刘旷专栏
在线音频江湖：内容大战、场景之争、AI博弈
智能手机、AI音箱、车联网全面普及，多个场景下用户对音频内容的需求逐渐增加，拓宽了在线音频平台商业化空间。而此刻，技术再次升级、音频与娱乐产业的融合、应用场景全覆盖，将推动在线音频行业更上一台阶。首先，AI助力在线音频广联万物。其次，AI助力音频内容的生产提速提质。再有，AI助力在线音频平台降本增效。2022年，互联网行业的关键词是降本增效，除了减少营销和行政等开支之外，还要归功于利用 AI工具或AI系统提高了企业运营和管理效率，在线音频行业也不例外。综上所述，新的技术升级周期给在线音频平台带来新的机遇，荔枝押注AI聊天、喜马拉雅关注AIGC、蜻蜓FM坚持“AI+音频”，头部在线音频平台已经率先行动，群雄纷起争上游，音频行业下一个黄金发展期值得期待。
53910编辑于 2023-03-23
来自专栏量子位
不识字也能翻译：谷歌AI直接用音频翻音频，不用先转文本
而AI在翻译语音的时候，不把西语的音频转成文本，也不生成任何英语的文本，直接产出了英文音频。和标答一字不差。这是谷歌团队的最新成果，想法大胆而有效。 ? AI只要从大量的成对数据里，学懂英文和西语的声谱映射关系，就算不识别人类说的是什么字，依然能当上翻译员。就是下图的蓝色部分，它负责生成目标声谱图，这只是第一步，还不是音频；二是一个声码器(Vocoder) 。里面的编码器 (左) ，是8层双向LSTM堆起来的；而解码器 (Spectrogram Decoder) ，团队说要选4-6层LSTM的，深一点效果比较好。借助转换文本来翻译的AI，缺了个“do”字： ? 第三题，带从句的句子。“我的表 (堂) 兄弟姐妹们小的时候，我照顾过他们也教过他们，有过一些这样的经历。”
2.1K20发布于 2019-04-22
AI 音频转视频秘籍：从原理到实践
在当今数字化时代，AI 技术正以前所未有的速度改变着我们创作和分享内容的方式。其中，AI 音频转视频技术为创作者们提供了一个全新的维度，使得将单纯的音频内容转化为富有视觉吸引力的视频变得轻而易举。一、AI 音频转视频的原理剖析AI 音频转视频并非魔法，其背后有着严谨的技术逻辑。当输入一段音频时，AI 系统首先会对音频进行全面分析。这包括解析音频的节奏、旋律、和声、音色等多个维度的特征。三、AI 音频转视频的操作步骤详解（一）准备阶段音频素材处理格式转换：确保你的音频素材格式符合所选 AI 工具的要求。常见的音频格式如 MP3、WAV、M4A 等，大多数工具都能支持。剪辑与优化：使用音频编辑软件（如 Audacity，一款免费开源的音频编辑工具）对音频进行必要的剪辑，去除开头和结尾不必要的空白部分，使音频内容更加紧凑。字幕添加与优化自动生成字幕：利用视频编辑软件的自动字幕生成功能（如剪映的智能字幕功能，Descript 的自动转录生成字幕功能），为视频添加字幕。
1.7K00编辑于 2025-08-07
来自专栏破晓
【AI音频处理】：重塑声音世界的无限可能
例如，利用AI进行自动混音、降噪、回声消除等操作，可以大大提升音频的质量和专业度。此外，AI还可以根据用户的需求自动调整音频的音量、音调等参数，实现一键式的声音美化。五、AI在音频分析中的深度应用情感识别音频分析不仅仅是关于声音的物理特性，还涉及到声音背后的情感表达。七、AI在音频处理中的挑战与未来技术挑战尽管AI在音频处理领域取得了显著进展，但仍面临诸多技术挑战。这些挑战需要研究者们不断探索和创新，以推动AI在音频处理领域的进一步发展。未来展望随着技术的不断进步和应用场景的不断拓展，AI在音频处理领域的未来充满了无限可能。我们可以预见，未来的AI将更加智能地理解和处理音频信息，为我们提供更加个性化、智能化的音频服务。同时，AI也将与其他技术如虚拟现实、增强现实等相结合，为我们带来更加沉浸式的音频体验。
1.4K10编辑于 2024-09-02
来自专栏君正T31开发实战指南
君正T31应用开发4-音频输出
1.什么是音频输出？其实手机，任何设备都有音频输出这个概念。 __); return NULL; } 3.2.IMP_AO_SetPubAttr /* Step 1: set public attribute of AO device. */ /*跟AI = 0) { IMP_LOG_ERR(TAG, "IMP_AO_ResumeChn error\n"); return NULL; } } 4.君正音频输出DEMO static = 0) { IMP_LOG_ERR(TAG, "enable ao %d err\n", devID); return NULL; } /* Step 3: enable AI channel = 0) { IMP_LOG_ERR(TAG, "Audio play enable channel failed\n"); return NULL; } /* Step 4: Set audio
1.6K00编辑于 2023-04-01
来自专栏人人都是极客
(干货)Ai音箱和Linux音频驱动小谈
= 1.024M 注意：我们在使用CX20810 ADC芯片的时候，CX20810现在是市面上做AI音响用的主流芯片，像叮咚叮咚就是用这个，里面介绍一个TDM 模式，这个也是一个I2S （4）ASOC介绍 ASOC--ALSA System on Chip （即ALSA在片选系统上的应用），是建立在标准ALSA驱动层上，为了更好地支持嵌入式处理器和移动设备中的音频Codec的一套软件体系七、AI智能音响核心点这部分讲的没一点内容都是非常核心的，直接影响到AI音箱的整体效果，包括声源定位，回声消除，有很多人反馈为什么我的音箱声源定位不好，为什么我的回声消除效果很差，我们就要从下面几个问题点去排查 4、喇叭与MIC的距离，不能太近；（3）、回声消除注意作用：抑制产品（喇叭）本身发出的声音，使得产品在播放音频时依然可以进行语音交互；注意点： 1、需要接参考信号，信号采样需要符合要求；做到有效采样；彩蛋： •ASR（automaticspeech recognition）把语音转换成文字，AI算法说的是自我学习算法，所以学习是一个非常复杂的过程，下面是一个链接，有开源的一些模型，感兴趣的可以自己拿去学习
4.7K21发布于 2019-11-20
来自专栏Dance with GenAI
AI办公自动化：多音频轨电影视频抽取出英语音频
很多电影视频是有中、英、粤语等多个音频轨的，如果直接转换成音频，很有可能不是自己想要的那种语音。可以先查看音频流信息，确定属于哪个音频轨： Reading video file: E:\1-7\比得兔1.mp4 输出音频流信息 Available audio streams: Stream 0: Stream 3: und - aac Stream 0应该是英语；然后，在Deepseek中输入提示词：你是一个Python编程专家，写一个Python脚本：读取视频："E:\1-7\比得兔1.mp4" 这个Mp4视频有多个音频轨，选择其中的Stream 0音频轨，提取出来保存为mp3音频文件，保存在和视频同一个文件夹中。输出完成信息 print(f"Audio extracted and saved to: {output_audio_path}") # 使用函数 video_path = "E:\\1-7\\比得兔1.mp4"
38310编辑于 2024-06-25
来自专栏腾讯多媒体实验室
腾讯天籁AI音频技术“破圈”背后的“密码”
基于领先的腾讯天籁音频解决方案，腾讯天籁不仅可以让不同地点、场景、设备终端同时远程接入，让远程线上沟通更加高效，并且还扩展了实时音频的语音带宽。与传统PSTN电话音质相比，使用了腾讯天籁技术后的音频音质更加明亮、干净。同时，整套音频算法能力也进行了有针对性的优化，可以在用户多种客户端进行部署，最终提升了音频通信的可懂度、自然度、舒适度。此外，在技术的研发过程中，该体系的测试结果，可以给研究人员提供非常重要参考信息，用于方案的打磨和优化。 ? 通过多种技术的优化和整合，实现了语音清晰度和可懂度提升40%的效果。经过提升后的信号，传递给人工耳蜗后，可以极大改善听障人士的听觉体验，让听障人士在“听得见”的基础上“听得清、听得真”。 9月27日国际聋人日之际，腾讯多媒体实验室联合腾讯公益慈善基金会、深圳市信息无障碍研究会等机构召开发布会，宣布发起“天籁行动”，通过面向公益开发者、设备厂商、NGO及行业免费开放腾讯天籁AI音频技术，帮助听障人群解决
1.2K50发布于 2020-11-03

第 2 页第 3 页第 4 页第 5 页第 6 页第 7 页第 8 页第 9 页第 10 页第 11 页

点击加载更多

游戏优化之音频压缩

FFmpeg编解码处理4-音频编码

AI处理文字、图片、PPT、音频、视频

音频正当时：我们和声网音频专家聊了聊AI、元宇宙、空间音频和“沉浸感”

4.页面优化

快速上手 AI ：AI 视频与音频生成教程

Mysql 优化存储4

4.Mysql 优化

用AI将m4b格式音频批量转换为mp3格式

只有音频没指纹，能抓对人吗？CMU音频分析AI说没问题

FFmpeg菜鸡互啄#第4篇#音频解码

枚举+优化（4）——哈希表优化实例2

在线音频江湖：内容大战、场景之争、AI博弈

不识字也能翻译：谷歌AI直接用音频翻音频，不用先转文本

AI 音频转视频秘籍：从原理到实践

【AI音频处理】：重塑声音世界的无限可能

君正T31应用开发4-音频输出

(干货)Ai音箱和Linux音频驱动小谈

AI办公自动化：多音频轨电影视频抽取出英语音频

腾讯天籁AI音频技术“破圈”背后的“密码”

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐