首页
学习
活动
专区
圈层
工具
发布

#音频

浏览器里藏着一个专业音频工作站?揭秘Web Audio API的硬核玩法

前端达人

这就是Web Audio API的价值所在。它不是简单的音频播放器,而是一套完整的音频处理管线系统,能让你像在FL Studio或Ableton Live里那样...

1700

OpenAI正准备发布其首个语音驱动型个人设备

春哥大魔王

从Meta为Ray-Ban智能眼镜配备五麦克风阵列增强听力,到特斯拉将xAI的聊天机器人Grok集成到车辆中实现语音控制导航和气候系统,再到OpenAI优化其音...

4710

进化独立的确定性解释模型 EVolutionary Independent DEtermiNistiC Explanation

CreateAMind

EVolutionary Independent DEtermiNistiC Explanation

3010

文心 ERNIE 5.0 技术报告解读:把“理解 + 生成”统一进一个自回归全模态大模型

时空探索之旅

1月22日,百度发布并上线原生全模态大模型文心5.0正式版。该模型参数达2.4万亿,采用原生全模态统一建模技术,具备全模态理解与生成能力,支持文本、图像、音频、...

16010

NotebookLM太强大了!PPT、视频等等鼠标点一点就出来了!还可以出题卡来验证你的学习效果。

Hello工控

如果是开放形式的学习,不涉及一些保密的资料,完全可以使用它来快速搭建学习的笔记,形式包括:txt文档、音频、视频等。

91530

前端使用 ffmpeg.wasm 合并 TS 文件(浏览器 FFmpeg 实战)

用户4105534

如果你用过视频处理工具,大概率知道这件事可以用 FFmpeg 一条命令完成。但对于大多数用户来说,命令行始终是个门槛。

10610

单卡4090即可实现96FPS流式推理!Soul App开源实时数字人生成模型SoulX-FlashHead

AI生成未来

在实时数字人赛道,开发者们曾长期面临一个困扰:追求高画质就需要具备昂贵的 H800 集群,追求低成本就得忍受“面瘫”和画面崩坏。

22710

好莱坞导演坐不住了!SkyReels-V4发布:首个影院级音视频联合生成/修复/编辑统一框架

AI生成未来

SkyReels-V4 能够生成最高达 1080p、32 FPS、15 秒的带同步音频的电影级多镜头视频。在 Artificial Analysis 的文本到视...

33010

字节Seedance2.0实测:多模态封神,AI视频创作彻底告别“抽卡式”生成

LiuDag

这是Seedance2.0最核心的技术突破之一:它支持文字、图片、音频、视频四种模态混合输入,单次最多可添加9张图片、3段视频、3段音频+文字指令,彻底打破了传...

68910

歌曲转换格式怎么使用命令符转换

hide

使用命令行转换歌曲格式,最常用且功能强大的工具是 FFmpeg。它支持几乎所有主流音频格式(如 MP3、WAV、FLAC、AAC、OGG 等),并可通过参数精细...

11710

使用HackRF实时接收FM广播信号

yichen

整体的思路是一样的,都是通过 HackRF 硬件接收信号,通过与正弦函数相乘进行频移,然后经过低通滤波器进行滤波,再进行重采样与解调,最终通过电脑音频播放出来

12510

Flutter for OpenHarmony音乐播放器实战:打造动态波形可视化与沉浸式播放体验

晚霞的不甘

在数字音频时代,音乐播放器早已超越“播放/暂停”的基础功能,演变为融合视觉艺术、交互设计与情感共鸣的综合体验。用户不仅用耳朵听音乐,更用眼睛“看”节奏——频谱跳...

13610

21:Ace-Step1.5 深度解析:高效音乐生成的技术革命

安全风信子

作者: HOS(安全风信子) 日期: 2026-02-07 主要来源平台: ModelScope 摘要: Ace-Step1.5作为新一代高效音乐基础模型...

32210

小归小,本事还不小(GM6403同步降压电源)

云深无际

共模的电源做的很不错,我陆陆续续的写了不少,然后最近我们再补充一些内容(最近写信号链写的都少了电源了):

10910

微软VibeVoice-ASR开源,60分钟长音频一口气转录,自带声纹识别和时间戳,强得可怕

Ai学习的老章

这是去年我的一个视频,里面有背景音和英文专业名词,识别效果还行,只是有些容易弄混的地方听错了,比如亿级转录成1级,不过这类错误估计其他模型也很难hold住。更妙...

75210

Anthropic登顶全球第一,吃掉370亿市场!投资大佬连夜抛OpenAI股票

新智元

Menlo Ventures发布的2025年AI报告显示,Anthropic发展势头强劲,已经占据了企业市场份额的榜首,达到40%的惊人份额。

22910

国产AI视频炸了!SkyReels-V3三大功能重磅开源,1张图生成逼真视频

新智元

3)音频驱动虚拟形象:一张肖像+一段音频,生成分钟级视频。重点是: 嘴型对得上、人物稳得住 。

86710

RK3568 音频驱动实验

一个平凡而乐于分享的小比特

作者简介: 一个平凡而乐于分享的小比特,中南民族大学通信工程专业研究生在读,研究方向无线联邦学习 擅长领域:驱动开发,嵌入式软件开发,BSP开发 作者主页:...

29610

昆仑万维开源的SkyReels-V3,把马斯克请来带货了

机器之心

1 月 29 日,Skywork AI 团队宣布开源 SkyReels-V3 多模态视频生成模型系列。该系列涵盖参考图像转视频、视频延长和音频驱动虚拟形象三大核...

35310
领券