首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏万少的技术分享

    让你的浏览器开口说话

    在线体验地址 http://sites.zbztb.cn/让你的浏览器开口说话.html 背景介绍 之前自己做的一个点名系统,可以支持语音播报,内部是调用了百度的在线体验语音接口API的,但是现在百度接口改了 = new SpeechSynthesisUtterance(); // 创建一个对象 属性 属性名 类型 作用 text String 设置要朗读的文字 pitch Number 设置音调 (0-2) device-width, initial-scale=1.0,maximum-scale=1,minimum-scale=1,user-scalable=no" /> <title>2. device-width, initial-scale=1.0,maximum-scale=1,minimum-scale=1,user-scalable=no" /> <title>让你的浏览器开口说话 } </style> </head> <body>

    请输入说话的内容

    36610编辑于 2025-02-10
  • 来自专栏翩翩白衣少年

    PDF2Audio:PDF一键转播客!让文档开口说话

    今天给大家推荐一款PDF转播客的开源工具:PDF2Audio,正好适合这种场景! 项目介绍 PDF2Audio 是一款出色的开源工具,旨在将 PDF 文档转换为音频内容,适合制作播客、讲座、讨论和摘要等。 安装与使用 本地/云服务部署 ① 克隆PDF2Audio仓库 git clone https://github.com/lamm-mit/PDF2Audio.git cd PDF2Audio ② 安装Python3.9 无论是教育播客、讲座还是个人学习,PDF2Audio 都能帮助你快速实现内容的音频化,提升信息传播的效率和趣味性。 现在就试试 PDF2Audio,开启你的播客制作之旅吧! 开源地址:https://github.com/lamm-mit/PDF2Audio

    1.4K10编辑于 2024-09-25
  • 来自专栏机器之心

    让真人照片说话算什么?Adobe新研究让插座都能开口说话

    机器之心报道 参与:魔王 不仅让真人图像开口说话,油画、素描、漫画等都能动起来! 给出一张面部图像和一段音频,能做什么?AI 有办法,比如让图像中的人开口说话! 该方法的另一个重要组件是预测能够反映说话人动态的面部特征点。基于该中间表征,该方法能够为真人头部图像合成说话状态视频。此方法还可用于艺术作品、素描、2D 卡通人物、日漫、随手涂鸦等图像。 ? 语音内容与说话人无关,仅捕捉嘴唇及周围区域的运动(参见图 2「Speech Content Animation」)。 说话人的身份信息则决定了动作的细节和说话人的其余头部动态(参加图 2「Speaker-Aware Animation」)。 例如,不管谁说单词「Ha!」嘴唇都会张开,这与说话人无关,仅取决于说话内容。 对于真人图像(图 8),则使用图像转换网络(类似于 pix2pix)将真人面部图像和底层特征点预测动态化(参见上图 2「Image2Image Translation」)。

    1K10发布于 2020-05-27
  • 来自专栏新智元

    DeepSeek会说话了!只要2行代码,这家公司让任意大模型秒开口

    此时,这个产品的另辟蹊径,就格外显得独树一帜——他们要做的,是让任意大模型开口说话,甚至是DeepSeek! 传送门:https://www.shengwang.cn/ConversationalAI/v2/ 接入DeepSeek V3模型的第一问,那便是自我介绍了——你知道自己很火吗? 2行代码,15分钟,让任意模型说话 对于开发者来说,调用声网的对话式AI引擎也非常简单。 只需2行代码、15分钟即可完成接入,大幅降低开发成本,同时保持高度灵活性和可定制性。

    55500编辑于 2025-02-26
  • 设备如何“开口说话”:技术实现与应用场景

    设备如何“开口说话”:技术实现与应用场景 核心技术原理 传感器与数据采集 设备通过嵌入式传感器(如温度、压力、运动传感器)实时采集物理状态数据,为语音输出提供原始信息。 格式规范示例 代码块格式: def example_function(): print("遵循代码块格式规范") 数学公式格式: $E=mc^2$ 直接嵌入文本,无需额外包装。

    18521编辑于 2025-12-08
  • 来自专栏信息技术智库

    数据挖掘不是挖土豆,而是让数据开口说话

    1.2 数据挖掘 - 让数据说话 我们正处于数据爆炸的时代,每天都有大量的数据产生,这些数据包含着潜在的有用信息,但由于其规模庞大、复杂多样,传统的数据分析方法已经无法满足需求。 2、数据挖掘的难点 数据挖掘不是挖土豆,有力气就行。数据挖掘存在一些技术难点,需要掌握一些基本的技术方法。我先讲难点,再讲方法。 判断执行环境 2. 导入 request 和 random 包 3. 输入代理账户信息 4. 执行代理访问 #! 4、数据挖掘的方法 Part 2 - 偷懒伸手党 如果想更加简单高效的获取数据, 也可以直接使用数据集商城。 但如何分析和使用数据,除了传统的分类、预测和聚类分析,这里我推荐 2 个亮数据在金融投资 和房产数据 方面的应用。

    35810编辑于 2024-03-26
  • 来自专栏《C++与 AI:个人经验分享合集》

    《代码注释:让你的代码“开口说话”的艺术》

    希望每一位开发者都能重视注释的编写,掌握注释的技巧,让代码能够清晰地“开口说话”,让编程之路更加顺畅,为软件行业的发展贡献更优质的代码和更高效的协作。

    35010编辑于 2024-12-09
  • 来自专栏编程教程

    Python类型注解:让代码“开口说话”的隐形助手

    例如,对比未注解的函数:def process_data(data): return data * 2与注解后的版本:def process_data(data: float) -> float: return data * 2后者一眼就能看出函数处理的是浮点数运算。 :[mypy]ignore_missing_imports = True # 忽略未标注类型的第三方库strict_optional = True # 强化Optional类型的检查2. 2. 忽略类型注解的维护当函数逻辑变更时,需同步更新类型注解。 从今天开始,为你的代码添加这些“智能标签”,让它们真正“开口说话”吧!​

    80810编辑于 2025-08-12
  • 来自专栏【腾讯云开发者】

    DeepSeek 3行代码接入小程序、10秒开口说话

    不仅如此,腾讯云音视频对话式 AI 解决方案,让 DeepSeek「开口说话」,3步就能跟 DeepSeek 侃大山。 云开发接入 AI常见问题可参考文档了解更多详情:https://docs.cloudbase.net/ai/FAQ //自然语音交互:3 步让 DeepSeek「开口说话」 光输出文字,不够过瘾。 腾讯云再亮「大招」—— 3 步操作,即可让 AI从「能打字」升级为「能说话」,把未来感的AI助手带进现实。 2、结合工作流和RAG能力,分钟级搭建并发布应用,问答结果更精准。 腾讯云实时音视频TRTC 对话式 AI快速实现让 DeepSeek开口说话 开发者/企业可在控制台选择想要使用的ASR、大模型、TTS 等能力,无代码快速跑通 AI实时对话应用 云开发 支持开发者调API

    1.2K10编辑于 2025-02-18
  • 来自专栏技术人生黄勇

    我的 OpenClaw 可以开口说话|NoizAI 技能安装使用教程

    让 AI 助手能用任意人的声音开口说话? 昨天我花了半天时间,给 ArkClaw 装上了 NoizAI 语音技能。 让特朗普为我朗读的 GitHub 今天热榜项目介绍。 如果你也想让 AI 助手"开口说",可以直接抄作业。 最终成果:能做什么 先看看最终效果。 触发方式:当你说「我想跟xxx聊天」「你来扮演xxx跟我说话」「让xxx给我讲讲这篇文章」时自动使用。 工作流程: 1. 角色确认(模糊时会先问你) 2. 让听音频的朋友,推荐装这个技能 NoizAI,让你的 AI 助手真正"开口说话"。 官方地址:https://github.com/NoizAI/skills 如果想让 AI 助手能开口说话,你希望克隆谁的音色,给你讲什么? -END-

    35820编辑于 2026-04-09
  • 来自专栏ATYUN订阅号

    Nature:不用开口说话,AI直接将大脑信号转译成言语

    为了给不能说话的人提供便利,神经科学家设计了一种可以将大脑信号转换为语音的系统,每分钟可产生约150个字,语速接近自然水平。 它可以破译大脑的运动指令,在说话时引导声音运动——轻拍舌头、抿紧嘴唇,并生成可理解的句子。 实验研究 专家表示,这项新工作是对原则的证明,预示了经过进一步实验和改进后可能实现的目标。 该系统在正常说话的人身上进行了测试,它还没有在神经系统疾病或损伤等可能导致解码困难的人身上进行测试。

    74840发布于 2019-05-14
  • 来自专栏速入大数据

    让数据“开口说话”——数据可视化的实用指南

    让数据“开口说话”——数据可视化的实用指南数据可视化,既是技术也是艺术。随着大数据时代的到来,数据可视化已成为洞察趋势、传递信息的关键方式。 本文将从明确目标、选择图表、简洁设计、突出重点等方面深入探讨,让你的数据真正“开口说话”。一、明确目标:数据展示的初心是什么?数据可视化并不是为了“炫酷”,它的核心目的是传达信息。

    59610编辑于 2025-04-02
  • 来自专栏编程技术

    让API开口说话,Swagger如何把枯燥代码变成“活文档”

    dependency>或者用Gradle的小伙伴:// 在build.gradle里“加点料”implementation 'io.springfox:springfox-boot-starter:3.0.0'第2步 这个系统是干什么的 2. 接口有什么特殊要求 3. select() .apis(RequestHandlerSelectors.basePackage("com.example.order")) .build();}2. 检查依赖是否正确2. 添加@EnableOpenApi注解(Swagger3)3. 检查SpringBoot版本兼容性问题2:界面出来了,但没显示API解决方案:1. 检查@RestController是否在扫描包内2. 检查@RequestMapping等注解是否正确3.

    16720编辑于 2026-03-26
  • 来自专栏开源服务指南

    让照片开口说话!基于音频生成动画 | 开源日报 No.253

    提供了基于 Llama 2 的大型语言模型,具有开放模型中最先进的性能。 支持填充功能、大输入上下文和 0-shot 指令跟随能力。

    47810编辑于 2024-05-10
  • 来自专栏新智元

    都给我开口说话!MakeItTalk的神奇魔法让你和蒙娜丽莎对话

    二是多个说话人会有不同的说话方式,控制嘴唇一致,不足以了解说话的人的性格,还要表达不同的个性。 这是一种具有深度架构的新方法,只需要一个音频和一个面部图像作为输入,程序就会输出一个逼真的「说话的头部动画」。 下面,我们就来看看,MakeItTalk的是如何让图片「说话」的。 都给我开口说话! 声音+图像=「开口说话」?MakeItTalk是如何做到的? (2)在训练阶段,使用现成的人脸检测器对输入的视频进行预处理,提取标记,从输入的音频中训练基础模型,实现语音内容转动画和标记的精确提取。 采用了两种算法进行标记到图像的合成: 对于非真实感的图像,如画布艺术或矢量艺术,一个特定的畸变方法是在 Delaunay triangulation 的基础上部署; 对于真实感图像,构建一个图像到图像的转换网络(与 pix2pix

    80710发布于 2020-10-29
  • 来自专栏量子位

    开口就能说话,脑波直接转语音,实现每分钟150词

    是的,不必动手,也不必开口,只要你的脑波流转,AI就能以每分钟150个词的速度帮你说出心声。 说话这件事其实并没有想象中那么简单,看似只是动动嘴,事实上却是对声道咬合结构精准、快速的多维度控制。 研究人员选择了深度学习方法。 为了进行试验,专家们招募了五名在医院接受癫痫治疗的志愿者。 ? 志愿者们说了上百句话,而通过植入性大脑皮层电图(ECoG),研究人员可以跟踪控制语言和发音的大脑区域的活动,并将这些活动与志愿者说话时嘴唇、舌头、喉部和下颚的微妙运动联系起来,然后将这些运动学特征翻译成口语句子 对比志愿者说话的频谱图和大脑信号合成的频谱图,可以看到它们已经非常接近了。 研究者们让以英语为母语的人听了听合成的语音,结果表明,至少有70%的虚拟语言是可以被理解的。 也有一些负面的声音: 我们总有法子让你开口的。 ? 嗯…不过事实上这项技术只会在你想开口时捕捉相应的脑电波。

    89130发布于 2019-05-13
  • 来自专栏耐达讯通信技术

    当土壤“开口说话”:RS232传感器如何搭上Profinet快车?

    2. 人工抄录效率低下:滞后且易错,无法支撑实时精准决策。3. 系统割裂:土壤数据游离于主控系统,价值无法释放。 2. 极简工程集成:网关作为标准Profinet设备,在西门子博途TIA Portal中轻松组态,大幅缩短调试周期。3.

    27010编辑于 2025-08-13
  • 这个Chrome扩展让网页开口说话,沉浸式朗读体验

    初遇:一个让网页"开口说话"的神器前段时间,我在找一款好用的网页朗读工具。市面上的TTS(文本转语音)工具不少,但要么收费,要么功能单一,要么界面丑得让人不想用。 这个扩展最大的特点就是:让任何网页都能"开口说话",而且体验做得特别棒。为什么说它"沉浸式"?1. 精确阅读:鼠标指哪读哪这是我最喜欢的功能。打开网页后,鼠标移到文字上,对应的句子会高亮显示。 这个功能特别适合:学习外语:可以听到标准发音,还能看到对应的文字校对文稿:听一遍,比看一遍更容易发现错别字深度阅读:眼睛累了,就闭上眼睛听,让大脑专注理解内容多任务处理:一边听文章,一边做其他事情2. 语速可调可以调节朗读速度,从0.5倍到2倍,适应不同场景。比如学外语时可以调慢一点,听新闻时可以调快一点。完全免费这是最让我惊喜的。功能这么丰富,居然完全免费,没有任何内购或者会员限制。 场景2:晚上睡前阅读晚上想看点东西,但眼睛已经累得不行了,也不想一直盯着屏幕。这时候打开一篇文章,闭上眼睛听,特别放松。既能获取信息,又不会影响睡眠。

    74010编辑于 2025-12-31
  • 来自专栏AI+运维:智能化运维的未来

    大模型让运维数据开口说话

    大模型让运维数据开口说话在运维领域,数据可视化一直是个绕不开的话题。过去,我们靠着静态报表、折线图、柱状图来“看”系统状态,似乎数据可视化就是这么回事了。 今天我们聊聊大模型——它不仅是AI界的风口,更是运维数据可视化的新解法,让数据真正“开口说话”。传统可视化的局限:你看到的只是冰山一角先说点现实情况。 2. 让告警分析更智能,不再陷入“告警风暴”运维人员最怕的,就是告警信息泛滥。日志告警、系统异常、流量突增……一下子几百条告警涌过来,谁都受不了。 AutoTokenizer.from_pretrained("mistral-7b")model = AutoModelForCausalLM.from_pretrained("mistral-7b")# 让运维数据"说话 总结:别再做运维数据的“搬运工”,让数据自己“开口说话”!大模型让数据可视化从“被动观察”升级为“主动理解”。它能预测趋势、优化告警、让故障分析变得更直观。

    23510编辑于 2025-05-09
  • 溯源技术革命:新型数字水印如何让数据“开口说话”,指认泄密源头?

    当泄密事件发生,能否不仅快速发现,更能够精准定位泄密源头,让数据自己“开口说话”?这正是新型数字水印技术所致力解决的问题。

    79910编辑于 2025-10-27
领券