首页
学习
活动
专区
圈层
工具
发布

#音频

被忽视的语音界面和多模态能力#工具箱更新

mixlab

最近,xiaozhi 新增了 MCP 能力的支持,我写了个工具用来接入任意的mcp到xiaozhi:

1400

fpga实现音频预加重(pre-emphasis)滤波器

FPGA技术江湖

1 .提升高频分量,平衡语音频谱,使得高频特征更加明显,便于后续的特征提取(如MFCC)。

2710

拆解小米智能家居中控屏

不脱发的程序猿

除基础供电管理外,MT6357还兼顾振动器驱动、LED指示灯控制等附加功能,并通过内置高质量音频编解码器实现双向音频信号处理,在保障稳定性的同时,丰富用户交互体...

4410

拆解小米麦克风

不脱发的程序猿

这款芯片专为音频类设备量身设计,具备丰富的接口配置与强劲的处理性能,可轻松应对音频编解码、音效处理等核心任务。

3210

苹果收购以色列AI初创公司Q.ai,交易金额接近20亿美元

芯智讯

综合彭博社、《金融时报》等多家外媒报道,苹果公司于当地时间1月29日宣布收购以色列人工智能初创公司Q.ai,交易金额接近20亿美元,使得该收购成为苹果历史上第二...

8410

2025年全球智能眼镜出货量将达1205万台,同比增长18.3%

芯智讯

3月24日,市场研究机构IDC发布预测报告称,2025年全球智能眼镜市场预计出货1205万台,同比增长18.3%。其中不具备显示功能的音频眼镜及音频拍摄眼镜预计...

17510

雅创电子:拟以不超过2亿元收购上海类比半导体部分股权

芯智讯

3月17日晚间,雅创电子发布公告称,公司拟以不超2亿元,购买上海类比半导体技术有限公司(以下简称“上海类比”)部分股权,最终投资金额和持股比例尚未确定,交易完成...

12010

mcp server-sequential-thinking 使用体验

golangLeetcode

可以看到,它的思路就是引导ai一步步思考,最后得到每一步的指示,最后得到结果,如果配合mcp的功能进行修正,就可以一步一步帮我吗完成复杂的功能。

15910

coze工作流文字生成视频

golangLeetcode

学习完Dify后Dify使用deepseek尝试使用下coze,发现流程和交互几乎一模一样,不过coze的插件更丰富些,特别是多媒体插件,就尝试...

19910

Meta 重磅开源 SAM Audio:第一次,剪音频像剪视频一样简单了。

开源星探

如果你有一段录音,里面混杂着人声、背景音乐、汽车喇叭声和狗叫声。你想把 “狗叫声”单独提取出来,或者反过来,你想把除了人声以外的所有声音都静音。

12510

TEN VAD 开源:低延迟、高准确率,提升「语音 Agent」上限就靠它!

开源星探

当我们在聊 Voice Agent、语音 AI、实时对话时,大家的注意力几乎都被 ASR、TTS、LLM 抢走了。

25910

19.9K Star!这个 GitHub 高赞 Whisper 优化项目,性能提升 4 倍,显存砍半!

开源星探

它允许同时并行处理多个音频片段,充分榨干 GPU 的算力,让显卡满载运行,拒绝“一核有难,八核围观”。

46110

52KB 的奇迹!NovaSR 开源:16kHz 秒变 48kHz,快出天际的音频超分模型!

开源星探

它通过学习大量高品质音频的频谱规律,当给它一段 16kHz 的低质音频时,它能通过神经网络预测并生成出原本不存在的 16kHz~24kHz 的高频部分,从而将音...

14010

微软重磅开源!22K星的 VibeVoice 再添新成员,60分钟音频 ASR 端到端统一输出!

开源星探

它最离谱的能力在于:拒绝切片,拒绝拼凑,它能在一个 64K 的超长上下文窗口内,一次性“吞下”整整 60 分钟的音频,并直接吐出完美的结构化结果。

24410

Soul App 又放大招!把 42000 小时数据喂出的“歌神” SoulX-Singer 开源了!

开源星探

不用下载任何东西,上传音频、输入歌词就能生成歌声,还能直接用内置 MIDI 编辑器调旋律(需魔法)

26410

Recall.ai - 会议转录 API,免费开源!

山行AI

大家好,如果你正在寻找一款适用于会议的转录 API,可以考虑使用 Recall.ai[1],这是一款支持 Zoom、Google Meet、Microsoft ...

14710

Voicebox-轻松管理你的语音克隆与音色设计

山行AI

•使用基于时间线的编辑器创建多语音叙事、播客和对话。•多轨编排 — 在一个项目中安排多个语音轨道•内联音频编辑 — 在时间轴中直接修剪和拆分音频片段•自动播放 ...

33110
领券