搜索 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

来自专栏万少的技术分享
让你的浏览器开口说话
在线体验地址 http://sites.zbztb.cn/让你的浏览器开口说话.html 背景介绍之前自己做的一个点名系统，可以支持语音播报，内部是调用了百度的在线体验语音接口API的，但是现在百度接口改了 device-width, initial-scale=1.0,maximum-scale=1,minimum-scale=1,user-scalable=no" /> <title>让你的浏览器开口说话 } </style> </head> <body>

请输入说话的内容
35610编辑于 2025-02-10
来自专栏机器之心
让真人照片说话算什么？Adobe新研究让插座都能开口说话
机器之心报道参与：魔王不仅让真人图像开口说话，油画、素描、漫画等都能动起来！给出一张面部图像和一段音频，能做什么？AI 有办法，比如让图像中的人开口说话！之前的方法往往学习音频和原始像素之间的直接映射进而创建人物的说话动态，而这项研究提出的方法将输入音频信号中的内容和说话人身份信息分离开来：音频内容用来稳健地控制嘴唇及周围区域的运动；说话人信息则决定面部表情的细节和人物的头部动态说话人的身份信息则决定了动作的细节和说话人的其余头部动态（参加图 2「Speaker-Aware Animation」）。例如，不管谁说单词「Ha!」嘴唇都会张开，这与说话人无关，仅取决于说话内容。而嘴唇的形状和张开的幅度，以及鼻子、眼睛和头部的动态则取决于说话人的身份。基于语音内容和说话人身份信息，MakeItTalk 模型为给定音频输出预测特征点序列。 ? 图 3：针对不同说话人身份的特征点预测。左：给定人脸图像的静态特征点；右上：对说话时头部动作较轻的人的预测特征点序列；右下：对说话时头部动作较大的人的预测特征点序列。
99910发布于 2020-05-27
来自专栏《C++与 AI：个人经验分享合集》
《代码注释：让你的代码“开口说话”的艺术》
希望每一位开发者都能重视注释的编写，掌握注释的技巧，让代码能够清晰地“开口说话”，让编程之路更加顺畅，为软件行业的发展贡献更优质的代码和更高效的协作。
33910编辑于 2024-12-09
来自专栏编程教程
Python类型注解：让代码“开口说话”的隐形助手
从今天开始，为你的代码添加这些“智能标签”，让它们真正“开口说话”吧！
74310编辑于 2025-08-12
设备如何“开口说话”：技术实现与应用场景
设备如何“开口说话”：技术实现与应用场景核心技术原理传感器与数据采集设备通过嵌入式传感器（如温度、压力、运动传感器）实时采集物理状态数据，为语音输出提供原始信息。
18421编辑于 2025-12-08
来自专栏信息技术智库
数据挖掘不是挖土豆，而是让数据开口说话！
1.2 数据挖掘 - 让数据说话我们正处于数据爆炸的时代，每天都有大量的数据产生，这些数据包含着潜在的有用信息，但由于其规模庞大、复杂多样，传统的数据分析方法已经无法满足需求。
35110编辑于 2024-03-26
来自专栏【腾讯云开发者】
DeepSeek 3行代码接入小程序、10秒开口说话！
不仅如此，腾讯云音视频对话式 AI 解决方案，让 DeepSeek「开口说话」，3步就能跟 DeepSeek 侃大山。云开发接入 AI常见问题可参考文档了解更多详情：https://docs.cloudbase.net/ai/FAQ //自然语音交互：3 步让 DeepSeek「开口说话」光输出文字，不够过瘾。腾讯云再亮「大招」—— 3 步操作，即可让 AI从「能打字」升级为「能说话」，把未来感的AI助手带进现实。第三步：开启对话，让 AI 真正「开口」所有配置完成后，点击「开始对话」，AI 直接开聊。腾讯云实时音视频TRTC 对话式 AI快速实现让 DeepSeek开口说话开发者/企业可在控制台选择想要使用的ASR、大模型、TTS 等能力，无代码快速跑通 AI实时对话应用云开发支持开发者调API
1.1K10编辑于 2025-02-18
来自专栏ATYUN订阅号
Nature：不用开口说话，AI直接将大脑信号转译成言语
为了给不能说话的人提供便利，神经科学家设计了一种可以将大脑信号转换为语音的系统，每分钟可产生约150个字，语速接近自然水平。它可以破译大脑的运动指令，在说话时引导声音运动——轻拍舌头、抿紧嘴唇，并生成可理解的句子。实验研究专家表示，这项新工作是对原则的证明，预示了经过进一步实验和改进后可能实现的目标。该系统在正常说话的人身上进行了测试，它还没有在神经系统疾病或损伤等可能导致解码困难的人身上进行测试。
74340发布于 2019-05-14
来自专栏速入大数据
让数据“开口说话”——数据可视化的实用指南
让数据“开口说话”——数据可视化的实用指南数据可视化，既是技术也是艺术。随着大数据时代的到来，数据可视化已成为洞察趋势、传递信息的关键方式。本文将从明确目标、选择图表、简洁设计、突出重点等方面深入探讨，让你的数据真正“开口说话”。一、明确目标：数据展示的初心是什么？数据可视化并不是为了“炫酷”，它的核心目的是传达信息。
57810编辑于 2025-04-02
来自专栏编程技术
让API开口说话，Swagger如何把枯燥代码变成“活文档”
前端小妹跑来问你：“哥哥，这个用户列表接口怎么调用呀？” 你自信满满：“看文档啊！” 然后她发来一张截图——你去年写的Word文档，上面写着：
11220编辑于 2026-03-26
来自专栏开源服务指南
让照片开口说话！基于音频生成动画 | 开源日报 No.253
SadTalker 是一个基于音频驱动的单幅图像对话头像动画生成项目。它可以将单幅人像图像与音频结合，生成逼真的视频对话头像。该项目的主要功能和核心优势包括：
46010编辑于 2024-05-10
来自专栏新智元
都给我开口说话！MakeItTalk的神奇魔法让你和蒙娜丽莎对话
二是多个说话人会有不同的说话方式，控制嘴唇一致，不足以了解说话的人的性格，还要表达不同的个性。这是一种具有深度架构的新方法，只需要一个音频和一个面部图像作为输入，程序就会输出一个逼真的「说话的头部动画」。下面，我们就来看看，MakeItTalk的是如何让图片「说话」的。都给我开口说话！说话者的信息被用来获取其他面部表情和头部动作，而这些对于生成富有表现力的头部动画是必需的。 MakeItTalk模型既可以生成逼真的人脸说话图像，也可以生成非逼真的卡通说话图像。声音+图像=「开口说话」？MakeItTalk是如何做到的？（4）内容与说话者无关，并且捕获了嘴唇和相邻部位的常见运动，其中说话内容调节了动作的特征和说话者头部动作的剩余部分。
80110发布于 2020-10-29
来自专栏量子位
不开口就能说话，脑波直接转语音，实现每分钟150词
是的，不必动手，也不必开口，只要你的脑波流转，AI就能以每分钟150个词的速度帮你说出心声。说话这件事其实并没有想象中那么简单，看似只是动动嘴，事实上却是对声道咬合结构精准、快速的多维度控制。研究人员选择了深度学习方法。为了进行试验，专家们招募了五名在医院接受癫痫治疗的志愿者。 ? 志愿者们说了上百句话，而通过植入性大脑皮层电图（ECoG），研究人员可以跟踪控制语言和发音的大脑区域的活动，并将这些活动与志愿者说话时嘴唇、舌头、喉部和下颚的微妙运动联系起来，然后将这些运动学特征翻译成口语句子对比志愿者说话的频谱图和大脑信号合成的频谱图，可以看到它们已经非常接近了。研究者们让以英语为母语的人听了听合成的语音，结果表明，至少有70%的虚拟语言是可以被理解的。也有一些负面的声音：我们总有法子让你开口的。 ? 嗯…不过事实上这项技术只会在你想开口时捕捉相应的脑电波。
88430发布于 2019-05-13
来自专栏耐达讯通信技术
当土壤“开口说话”：RS232传感器如何搭上Profinet快车？
在智慧农业浪潮席卷全球的今天，精准掌控土壤墒情（湿度、温度、养分等）是优化水肥、提升产量的核心。然而，许多农场仍在使用性能稳定但“语言过时”的RS232接口土壤传感器，它们与现代基于Profinet工业以太网的自动化控制系统格格不入，形成令人头疼的“数据孤岛”。如何让这些宝贵的“土壤侦察兵”顺利搭上Profinet的高速列车？
24810编辑于 2025-08-13
来自专栏翩翩白衣少年
让文档开口说话！
PDF2Audio 是一款出色的开源工具，旨在将 PDF 文档转换为音频内容，适合制作播客、讲座、讨论和摘要等。
1.3K10编辑于 2024-09-25
这个Chrome扩展让网页开口说话，沉浸式朗读体验
初遇：一个让网页"开口说话"的神器前段时间，我在找一款好用的网页朗读工具。市面上的TTS（文本转语音）工具不少，但要么收费，要么功能单一，要么界面丑得让人不想用。这个扩展最大的特点就是：让任何网页都能"开口说话"，而且体验做得特别棒。为什么说它"沉浸式"？1. 精确阅读：鼠标指哪读哪这是我最喜欢的功能。打开网页后，鼠标移到文字上，对应的句子会高亮显示。
64410编辑于 2025-12-31
来自专栏AI+运维：智能化运维的未来
大模型让运维数据开口说话
大模型让运维数据开口说话在运维领域，数据可视化一直是个绕不开的话题。过去，我们靠着静态报表、折线图、柱状图来“看”系统状态，似乎数据可视化就是这么回事了。今天我们聊聊大模型——它不仅是AI界的风口，更是运维数据可视化的新解法，让数据真正“开口说话”。传统可视化的局限：你看到的只是冰山一角先说点现实情况。 AutoTokenizer.from_pretrained("mistral-7b")model = AutoModelForCausalLM.from_pretrained("mistral-7b")# 让运维数据"说话总结：别再做运维数据的“搬运工”，让数据自己“开口说话”！大模型让数据可视化从“被动观察”升级为“主动理解”。它能预测趋势、优化告警、让故障分析变得更直观。
22410编辑于 2025-05-09
溯源技术革命：新型数字水印如何让数据“开口说话”，指认泄密源头？
当泄密事件发生，能否不仅快速发现，更能够精准定位泄密源头，让数据自己“开口说话”？这正是新型数字水印技术所致力解决的问题。
74410编辑于 2025-10-27
来自专栏速入大数据
数据可视化：艺术与科学的交汇点，如何让数据“开口说话”？
数据可视化：艺术与科学的交汇点，如何让数据“开口说话”？数据可视化，是科技与艺术的结合，是让冰冷的数字变得生动有趣的桥梁。一个精心设计的可视化能让人产生共鸣，让数据“说话”。颜色的重要性：比如在气候变化可视化中，暖色调（红色、橙色）可以传递热浪的紧迫感，而冷色调（蓝色、绿色）可以表现污染减少的希望。
28910编辑于 2025-05-07
来自专栏新智元
DeepSeek会说话了！只要2行代码，这家公司让任意大模型秒开口
此时，这个产品的另辟蹊径，就格外显得独树一帜——他们要做的，是让任意大模型开口说话，甚至是DeepSeek！ 2行代码，15分钟，让任意模型说话对于开发者来说，调用声网的对话式AI引擎也非常简单。只需2行代码、15分钟即可完成接入，大幅降低开发成本，同时保持高度灵活性和可定制性。
52200编辑于 2025-02-26

第 2 页第 3 页第 4 页第 5 页第 6 页第 7 页第 8 页第 9 页第 10 页第 11 页

点击加载更多

让你的浏览器开口说话

让真人照片说话算什么？Adobe新研究让插座都能开口说话

《代码注释：让你的代码“开口说话”的艺术》

Python类型注解：让代码“开口说话”的隐形助手

设备如何“开口说话”：技术实现与应用场景

数据挖掘不是挖土豆，而是让数据开口说话！

DeepSeek 3行代码接入小程序、10秒开口说话！

Nature：不用开口说话，AI直接将大脑信号转译成言语

让数据“开口说话”——数据可视化的实用指南

让API开口说话，Swagger如何把枯燥代码变成“活文档”

让照片开口说话！基于音频生成动画 | 开源日报 No.253

都给我开口说话！MakeItTalk的神奇魔法让你和蒙娜丽莎对话

不开口就能说话，脑波直接转语音，实现每分钟150词

当土壤“开口说话”：RS232传感器如何搭上Profinet快车？

让文档开口说话！

这个Chrome扩展让网页开口说话，沉浸式朗读体验

大模型让运维数据开口说话

溯源技术革命：新型数字水印如何让数据“开口说话”，指认泄密源头？

数据可视化：艺术与科学的交汇点，如何让数据“开口说话”？

DeepSeek会说话了！只要2行代码，这家公司让任意大模型秒开口

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐