首页
学习
活动
专区
圈层
工具
发布

#语音

为了搞懂Agent,我带老婆去了趟大理

用户7243329

我直接拍张照发给 AI。他看了一眼(图像识别),马上语音回复(语音生成):快扔了,这玩意儿有毒。

5010

TWeTalk语音智能体:以超低延迟与情感交互重塑AIoT设备体验

IT前沿资讯站

腾讯科技(深圳)有限公司 | 数据分析 (已认证)

解决传统硬件交互迟滞与情感缺失痛点 智能硬件行业面临核心瓶颈:语音交互延迟高(通常>1500ms)、机械式应答缺乏情感连接、多模态协同能力不足。传统方案在嘈杂环...

13410

免费但好用,两个极品多功能转换工具推荐!

搜罗万相

还是一个在线的文本转语音(TTS)工具,支持超过 600 种 AI 声音和 100 多种语言,本来开头又想说一个功能强大的,感觉最近介绍什么都说一个功能强大的,...

10310

OpenClaw:这个开源“数字员工”到底能干啥?20个真实应用场景深度拆解

不吃草的牛德

兄弟们,2026年2月,AI圈最疯的事不是新模型,而是OpenClaw(前身Clawdbot → Moltbot)。

18610

SenseVoice使用记录

软件测试大叔

16k中文通用VAD模型:可用于检测长语音片段中有效语音的起止时间点。FSMN-Monophone VAD是达摩院语音团队提出的高效语音端点检测模型,用于检测输...

13110

奥尔特曼:AI已能破解大多数身份验证方式

用户11193371

奥尔特曼说:“我非常担心,我们面临一场迫在眉睫的重大欺诈危机。现在,这可能意味着一个语音电话;但很快,它就会变成视频或 FaceTime (苹果视频聊天软件),...

11110

腾讯云音视频产品矩阵技术概要

IT前沿资讯站

腾讯科技(深圳)有限公司 | 数据分析 (已认证)

游戏多媒体引擎(GME) 是面向游戏场景的一站式语音解决方案,提供实时语音、语音消息、语音转文本等服务。日服务时长 10亿分钟,全球连通率和可用性 高于99.9...

15510

【做爆款视频必备】NarratoAI使用指南:用AI玩转短剧解说,小白也能秒变剪辑大神

AiAgent 马化云

咱先唠明白,NarratoAI是帮咱普通人用AI做短剧解说、视频剪辑的神器——既能让你薅到AI的羊毛,又不用啃满屏代码。

21210

小众需求,精细化架不住有人喜欢!

搜罗万相

最近发现很多行业很多人都在精细化,为什么说到人,像以前有什么我们就玩什么,比如说玩泥巴,钓鱼,打鸟,养宠物,现在大家看看,哪一个不是精细化。

14810

新老更替,有的注定远去,有的又获新生!

搜罗万相

最近关于360doc 个人图书馆,像比如天涯社区、猫扑网、西祠胡同、人人网、开心网等网站更是消失了很多年。

13210

马斯克展示AI5处理器样品,称性能较前代飙升40倍

芯智讯

AI5处理器将由台积电(3nm制程)和三星电子(2nm制程)共同生产,显示出特斯拉的多供应商策略。这个生产链还与马斯克主导的其他项目有关,包括英特尔在德州的Te...

13910

Google 发布 Gemini 3 语音助手!说句话就能开发 AI 应用

PMAIhub

3 月 26 日,Google for Developers 官方频道发布了一段演示视频,展示了全新的 Gemini 3 Flash Live 模型。

24910

具备情绪感知的,智能语音对话系统方案

索旭东

生产级(8–12周): 阿里云+emotion2vec → 成本 ¥0.8–1.2/分钟

18210

智能语音对话系统技术方案

索旭东

问题: 用户说话 → ASR识别 → RAG检索 → LLM生成 → TTS合成,全链路可能 > 3秒

19910

有字幕,没配音?用浏览器自带语音能力,让网页视频直接“开口说话”

桑榆肖物

但在不同浏览器上的表现可能会有差异,主要是厂商增加的在线语音库和优化。Edge 浏览器在这方面做得不错,提供了丰富的语音选项和较好的兼容性。Google Chr...

19110

从 0 到 1 实现 Java 与语音设备的 MQTT 通信:物联网语音交互全攻略

果酱带你啃java

在智能家居、工业控制、智能穿戴等场景中,语音设备(如智能音箱、语音控制面板、工业语音对讲机)已成为人机交互的核心入口。这些设备通常具有低带宽、高并发、弱网络依赖...

13710

别再内耗了!快把那个“爱碎碎念”的MindBack当成你的第二大脑

程序那些事儿

在这个连写个朋友圈都要字斟句酌、反复分组的年代,我们似乎弄丢了 “记录” 最原始的快乐。

24110

inFin你的随身无限语音AI笔记

程序那些事儿

14810

腾讯AI语音IM场景落地实践:山东云盟文化传媒的延迟、成本与玩法优化

IT资讯研究所

腾讯科技 | 研究员 (已认证)

山东云盟文化传媒有限公司在语音IM场景中面临四方面理想与现实的差距:需保障流畅体验却受延迟、卡顿、音质差困扰;追求服务稳定但存在稳定性不足问题;期望玩法创新却受...

16810

腾讯云TRTC与AI技术提升语音IM体验,破解行业共性难题

IT前沿资讯站

腾讯科技(深圳)有限公司 | 数据分析 (已认证)

应对高并发场景下的实时音质与延迟挑战 直播及社交平台面临网络条件差异大、自建服务不稳定导致的延迟、卡顿与音质下降问题,直接影响用户参与度和留存率。传统RTMP架...

16510
领券