首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏全栈之路

    游戏优化音频压缩

    其实这个比较容易忽略掉,但是音频资源如果不压缩的话,可能会造成游戏加载速度慢,尤其是对于一些音频资源依赖较高的游戏。 来看一下效果: ? 好了,其实这里要介绍的是一条命令,它依赖于ffmpeg。 具体如下: ffmpeg -i ${f} -vn -ar 22050 -ac 1 -ab 128 -f mp3 ${dst} 其中$f为源文件,$dst为目标文件 接下来介绍一下mac上的音频压缩脚本, ~" 用法,格式将输出为mp3格式: audio.sh -s <音频源目录> -d <音频资源目录>

    1.6K30发布于 2018-10-19
  • 来自专栏练习bug时长两年半

    Windows11优化

    Windows11优化 1.还原到windows10右键 以管理员身份运行CMD,复制下列命令,按回车后即可恢复Win10的右键菜单 reg add "HKCU\Software\Classes\CLSID 如果想恢复Win11菜单,就把添加的注册表项删掉。 reg delete "HKCU\Software\Classes\CLSID\{86ca1aa0-34aa-4e8b-a509-50c905bae2a2}" /f 2.任务栏对齐方式调整 Win11默认将任务栏图标放在了中间

    1.3K10编辑于 2022-08-24
  • 来自专栏Linux驱动

    11.QT-ffmpeg+QAudioOutput实现音频播放器

    所以接下来,我们使用ffmpeg+QAudioOutput来实现一个简单的音频播放器. 2.界面展示 因为业余爱好,只是简单实现了大部分功能,支持播放、暂停、恢复、换歌、播放进度调节,如下图所示: ? info.isFormatSupported(format)) { qDebug()<<"输出设备不支持该格式,不能播放音频"; return false; int ret; int destMs,currentMs; if(audio==NULL) { emit ERROR("输出设备不支持该格式,不能播放音频 initAudio(44100)) { emit ERROR("输出设备不支持该格式,不能播放音频"); } while(1) { switch

    3.2K20发布于 2020-09-14
  • AI处理文字、图片、PPT、音频、视频

    AI技术快速发展的今天,各类大模型与智能工具层出不穷,其能力各有侧重,都在不断迭代更新。选择工具的关键,在于明确自己的核心需求场景。 AI 创作工具,擅长短视频与图文创意生成;风格贴合抖音生态,支持快速出片,免费版有功能限制内容创作悠船专注于内容创作辅助,支持文案生成、创意构思、内容优化;适配自媒体、营销场景,操作便捷,部分功能需付费智能体开发 11.百度度加文字转视频效率高,绑定百家号可流量倾斜;内置热搜榜单,适配百度系平台分发,适合资讯类内容快速创作。 16.即梦字节系 AI 创作工具,擅长短视频与图文创意生成;风格贴合抖音生态,支持快速出片,免费版有功能限制。 17.扣子(Coze)低代码搭建专属 AI 智能体,无需深厚编程基础;内置丰富插件与知识库,支持自定义对话流程;因为没有数据库,数据是直接写死的。总结而言,AI工具的选择并非“一刀切”。

    71910编辑于 2026-01-12
  • 来自专栏音视频技术

    音频正当时:我们和声网音频专家聊了聊AI、元宇宙、空间音频和“沉浸感”

    近日,LiveVideoStack采访到了声网的音频算法负责人冯建元,请他来跟大家聊聊音频相对于视频的优势、音频在元宇宙中的应用、国内音频技术与AI结合的发展、过去一年声网在音频领域所取得突破和对前沿音频技术的探索 我关注的音频领域还是比较多的,从基于AI的语音编解码器、空间音频到声纹变声等都有在关注和尝试。 LiveVideoStack: 目前AI音频技术的结合已经成为一种趋势,比如AI技术常用于音频降噪、回声消除和音频特效等。除此之外,AI音频的技术结合还有哪些新的探索? 实时变声,甚至空间音频中的个性化HRTF都可以用AI模型生成,可以说AI几乎已经融入到了音频的每一个角落。 冯建元:我觉得国内在AI音频技术结合上已经是国际第一流的水平,尤其在严肃、传统的3A处理领域。在音乐、AI Codec等比较新的领域,我们则可能处于平分秋色或者在前沿探索方面略显滞后。

    77620编辑于 2022-04-19
  • 来自专栏猫头虎AI技术分享

    快速上手 AIAI 视频与音频生成教程

    快速上手 AIAI 视频与音频生成教程 摘要:随着生成式AI的爆发式发展,音视频创作已经从“专业技能”转变为“人人可用”的智能工具。 无论你是开发者、内容创作者,还是新媒体运营者,通过AI生成视频和音频,都能显著提升效率与创意质量。 本文将从==AI音频生成、AI视频生成、工具对比、应用实例==四大方向带你快速上手,并附带一键上手代码与流程图可视化讲解。 AI音频:支持多语言、多音色的语音克隆、音乐生成、背景音合成等。 音频生成快速上手 1.

    4.4K351编辑于 2025-10-06
  • 来自专栏小工匠聊架构

    Oracle优化11-10046事件

    MyBatis-Spring可以将MyBatis代码无缝整合到Spring中,使用这个类库中的类,Spring将会加载必要的MyBatis工厂类和Session类。 这个类库也提供了一种简单的方式将MyBatis数据映射器和SqlSession注入到业务层的bean中,而且也可以处理事务,翻译MyBatis的异常到Spring的DataAcessException数据访问异常中。

    41020发布于 2021-08-16
  • 来自专栏Niko的小窝

    Windows11 美化+优化教程

    回到咱们主题: Windows11美化+优化教程 注意,是Windows 11。禁止Windows 10仿Win11入内! Dism++优化 美化易上头,一上头就把持不住。尽早跳出坑来,让其他人跳进去。嘻嘻~ 下载解压后,选择自己系统版本,打开对应的Dism++ EXE,尽自己所能优化,不会别动就行。

    5.9K30编辑于 2022-03-29
  • 来自专栏数据库学习笔记

    【参数优化11gR2安装后参数优化

    以下为11gR2安装完成后需要优化的参数,建议PC端查看。 前序: 【安装】CentOS7.7下图形化安装Oracle11gR2 【补丁】Oracle11gR2补丁更新(PSU) 一、参数优化 #如果指定为TRUE, 并行操作只会在当前instance里面并行 "=1200 scope=spfile; #基数反馈(Cardinality Feedback )是 Oracle 11.2 中引入的关于 SQL 性能优化的新特性 但是该参数存在不稳定因素,可能会带来执行效率的问题,建议关闭优化器反馈。 11R2会遇到一个BLOOM过滤器导致的BUG 9124206和BUG 8361126,出现ORA-00060 ORA-10387错误 alter system set "_bloom_filter_enabled

    1.6K30发布于 2021-04-22
  • 来自专栏量子位

    只有音频没指纹,能抓对人吗?CMU音频分析AI说没问题

    然鹅,现在有了AI音频分析技术已经到了前所未有的高度。 Rita Singh,是这一领域的顶尖科学家,工作于卡内基·梅隆大学的语言技术研究所。 Singh和她卡耐基梅隆的同事所研发的这套音频分析技术,可以找出人都听不出来的细微差别。 她们可以把音频切成毫秒的片段,然后用AI技术来梳理处理这些片段以寻找独特的标识。 当你说话的时候,AI可以猜出你所在房间的大小,房间是否有窗户,墙体是什么材质的。 更不可思议的是,AI还可以根据当地电网的电压波动,判断出打电话的人的物理位置,以及是一天当中什么时间段打出的电话。 AI技术的引入,对于那些总是爱报假警的人来说是个坏消息。要知道,在美国报假警触犯了联邦法律,处罚很重而且还要进去蹲好几年。 Singh的技术大大减少了这类事件的发生,还快速准确地锁定了罪犯。 AI技术的发展速度都是指数级别的,可以预见到未来,音频分析将会用于法律定罪以外的领域。

    82590发布于 2018-03-22
  • 来自专栏刘旷专栏

    在线音频江湖:内容大战、场景之争、AI博弈

    智能手机、AI音箱、车联网全面普及,多个场景下用户对音频内容的需求逐渐增加,拓宽了在线音频平台商业化空间。 而此刻,技术再次升级、音频与娱乐产业的融合、应用场景全覆盖,将推动在线音频行业更上一台阶。 首先,AI助力在线音频广联万物。 其次,AI助力音频内容的生产提速提质。 再有,AI助力在线音频平台降本增效。2022年,互联网行业的关键词是降本增效,除了减少营销和行政等开支之外,还要归功于利用 AI工具或AI系统提高了企业运营和管理效率,在线音频行业也不例外。 综上所述,新的技术升级周期给在线音频平台带来新的机遇,荔枝押注AI聊天、喜马拉雅关注AIGC、蜻蜓FM坚持“AI+音频”,头部在线音频平台已经率先行动,群雄纷起争上游,音频行业下一个黄金发展期值得期待。

    53910编辑于 2023-03-23
  • 来自专栏量子位

    不识字也能翻译:谷歌AI直接用音频音频,不用先转文本

    AI在翻译语音的时候,不把西语的音频转成文本,也不生成任何英语的文本,直接产出了英文音频。和标答一字不差。 这是谷歌团队的最新成果,想法大胆而有效。 ? AI只要从大量的成对数据里,学懂英文和西语的声谱映射关系,就算不识别人类说的是什么字,依然能当上翻译员。 就是下图的蓝色部分,它负责生成目标声谱图,这只是第一步,还不是音频; 二是一个声码器(Vocoder) 。 借助转换文本来翻译的AI,缺了个“do”字: ? 第三题,带从句的句子。“我的表 (堂) 兄弟姐妹们小的时候,我照顾过他们也教过他们,有过一些这样的经历。” 肉眼看过之后,再让S2ST和先转换文本再翻译的AI对比一下BLEU分。 在“Conversational”大数据集上,S2ST的BLEU分比对手差了6分:42.7比48.7。 ?

    2.1K20发布于 2019-04-22
  • 来自专栏工作总结

    优化if-else的11种方案

    优化前:public class NoEarlyReturnExample { public boolean hasPositiveNumber(int[] numbers) { boolean // 没有早返回,而是继续循环 } } return foundPositive; // 循环结束后返回结果 }}优化优化前:public class NoTernaryOperatorExample { public String getGender(int number) { if (number if (number < 0) { return "boy"; } else { return "other"; } }}优化11. 使用异常处理:在某些情况下,使用异常处理来简化错误条件的处理。

    28500编辑于 2024-08-05
  • 来自专栏福大大架构师每日一题

    音视频八股文(11)-- ffmpeg 音频重采样

    所谓的重采样,就是改变⾳频的采样率、sample format、声道数等参数,使之按照我们期望的参数输出。

    1.4K20编辑于 2023-05-11
  • 来自专栏破晓

    AI音频处理】:重塑声音世界的无限可能

    例如,利用AI进行自动混音、降噪、回声消除等操作,可以大大提升音频的质量和专业度。此外,AI还可以根据用户的需求自动调整音频的音量、音调等参数,实现一键式的声音美化。 五、AI音频分析中的深度应用 情感识别 音频分析不仅仅是关于声音的物理特性,还涉及到声音背后的情感表达。 七、AI音频处理中的挑战与未来 技术挑战 尽管AI音频处理领域取得了显著进展,但仍面临诸多技术挑战。 这些挑战需要研究者们不断探索和创新,以推动AI音频处理领域的进一步发展。 未来展望 随着技术的不断进步和应用场景的不断拓展,AI音频处理领域的未来充满了无限可能。 我们可以预见,未来的AI将更加智能地理解和处理音频信息,为我们提供更加个性化、智能化的音频服务。同时,AI也将与其他技术如虚拟现实、增强现实等相结合,为我们带来更加沉浸式的音频体验。

    1.4K10编辑于 2024-09-02
  • AI 音频转视频秘籍:从原理到实践

    在当今数字化时代,AI 技术正以前所未有的速度改变着我们创作和分享内容的方式。其中,AI 音频转视频技术为创作者们提供了一个全新的维度,使得将单纯的音频内容转化为富有视觉吸引力的视频变得轻而易举。 一、AI 音频转视频的原理剖析​AI 音频转视频并非魔法,其背后有着严谨的技术逻辑。当输入一段音频时,AI 系统首先会对音频进行全面分析。这包括解析音频的节奏、旋律、和声、音色等多个维度的特征 。 三、AI 音频转视频的操作步骤详解​(一)准备阶段​音频素材处理​格式转换:确保你的音频素材格式符合所选 AI 工具的要求。常见的音频格式如 MP3、WAV、M4A 等,大多数工具都能支持。 剪辑与优化:使用音频编辑软件(如 Audacity,一款免费开源的音频编辑工具)对音频进行必要的剪辑,去除开头和结尾不必要的空白部分,使音频内容更加紧凑。 字幕添加与优化​自动生成字幕:利用视频编辑软件的自动字幕生成功能(如剪映的智能字幕功能,Descript 的自动转录生成字幕功能),为视频添加字幕。

    1.7K00编辑于 2025-08-07
  • 来自专栏前端新视界

    Angular 11 中 Schematics 的代码优化

    前言 升级 Angular 11 已经是几个月之前的事情了,在升级 Angular 11 之后,schematics 有些函数的用法变了,直接运行会报错,花了两天时间纠正了部分 API。 函数优化 1、使用 async/await 获取工作空间 更新前 function addLoaderToIndex(options: Schema): (host: Tree) => Tree { workspace, options.project); const projectIndexFiles = getProjectIndexFiles(project); ... } } 更新 11 总结 在升级 Angular 11 之后,除了上面提到的方法优化之外,还有一些方法的删减,总的来说, schematics 的代码变得更加简洁了。

    1.3K20发布于 2021-04-30
  • 来自专栏针针小站

    【Soft】Advanced SystemCare 11 系统优化清理

    Advanced SystemCare 11 是一款易于使用的Windows电脑优化工具。它帮助用户清洁、优化、加速和保护系统,以及保护用户的在线隐私。 一款能分析系统性能瓶颈的优化软件。 通过对系统全方位的诊断,找到系统性能的瓶颈所在,然后针对性地进行修改、优化您的PC ? Advanced SystemCare 11功能可谓是非常多 个人最喜欢的还是内存优化功能 接下来 看图吧 ---- 安装过程 ? ? ? ? ? ? ---- 主页面板 ? 最好用的内存优化 ? 更强大的悬浮窗 ? ---- 还有很多优化的 就靠大家摸索啦~ 下载地址在墙外 搬运回国了~ 下载地址 联网激活key: 温馨提示: 此处内容需要评论本文后才能查看.----

    90970发布于 2018-06-25
  • 来自专栏人人都是极客

    (干货)Ai音箱和Linux音频驱动小谈

    蓝色代表模拟音频信号,红色的点代表采样得到的量化数值。采样频率越高,红色的间隔就越密集,记录这一段音频信号所用的数据量就越大,同时音频质量也就越高。 个数据线,这时候计算的时候ch还是用2来计算 BCLK = 16K x 32bitsx2ch = 1.024M 注意:我们在使用CX20810 ADC芯片的时候,CX20810现在是市面上做AI 音频跟视频很不一样,视频每一帧就是一张图像,而从上面的正玄波可以看出,音频数据是流式的,本身没有明确的一帧帧的概念,在实际的应用中,为了音频算法处理/传输的方便,一般约定俗成取2.5ms~60ms为单位的数据量为一帧音频 七、AI智能音响核心点 这部分讲的没一点内容都是非常核心的,直接影响到AI音箱的整体效果,包括声源定位,回声消除,有很多人反馈为什么我的音箱声源定位不好,为什么我的回声消除效果很差,我们就要从下面几个问题点去排查 内部音腔隔离 震动隔离 喇叭与MIC的相对位置; 3、硬件选型方面需要注意; 4、整个采样系统中的延时要稳定; 彩蛋: •ASR(automaticspeech recognition)把语音转换成文字,AI

    4.7K21发布于 2019-11-20
  • 来自专栏Dance with GenAI

    AI办公自动化:多音频轨电影视频抽取出英语音频

    很多电影视频是有中、英、粤语等多个音频轨的,如果直接转换成音频,很有可能不是自己想要的那种语音。 可以先查看音频流信息,确定属于哪个音频轨: Reading video file: E:\1-7\比得兔1.mp4 输出音频流信息 Available audio streams: Stream 0: aac Stream 0应该是英语; 然后,在Deepseek中输入提示词: 你是一个Python编程专家,写一个Python脚本: 读取视频:"E:\1-7\比得兔1.mp4" 这个Mp4视频有多个音频轨 ,选择其中的Stream 0音频轨,提取出来保存为mp3音频文件,保存在和视频同一个文件夹中。 print(f"Selected audio stream: Stream {stream_index} - {selected_stream['codec_name']}") # 构建输出音频文件路径

    38310编辑于 2024-06-25
领券