首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏Dance with GenAI

    零代码编程:用ChatGPT将vtt转换成LRC和srt格式的字幕

    要把VTT字幕文件转换成SRT或LRC格式,可以使用Python的webvtt库。 安装命令: pip install webvtt-py WebVTT字幕格式与SRT字幕格式主要区别在于时间格式的区分。 下面是一个WebVTT格式的字幕文件 00:00:20.000 --> 00:00:24.400 En réponse à l'augmentation dramatique de la criminalité lexfridman-podcast\vtt 读取文件夹中的vtt后缀文件,然后转换成SRT格式和LRC格式; 注意:每一步都要输出相关信息 ChatGPT给出的源代码: import os import webvtt convert_vtt_to_srt(vtt_filename, srt_filename): print(f"正在将 {vtt_filename} 转换为 {srt_filename}") vtt = webvtt.read

    1.4K10编辑于 2024-06-24
  • 来自专栏Michael阿明学习之路

    使用edge-tts将文字转成语音

    submaker.create_sub((chunk["offset"], chunk["duration"]), chunk["text"]) with open(WEBVTT_FILE VOICE = "zh-CN-YunyangNeural" # ShortName OUTPUT_FILE = "test1.mp3" WEBVTT_FILE = "test.vtt"

    3K00编辑于 2024-05-24
  • 来自专栏全栈程序员必看

    走进音视频的世界——Matroska封装格式的介绍(二)「建议收藏」

    S_TEXT / WEBVTT 编解码器ID:S_TEXT / WEBVTT 编解码器名称:Web视频文本轨道格式(WebVTT) 描述:高级文本字幕。 WebVTT “ Web视频文本轨道格式”(简称:WebVTT)由万维网联盟(W3C)开发。其规格可免费获得。 在Matroska中存储WebVTT的指导原则是: 一致性:以与其他字幕编解码器类似的方式存储数据 简单性:使现有基础架构的解码和重新混合尽可能容易 完整性:从原始WebVTT文件中保留尽可能多的数据 存储WebVTT CodecID:编解码器标识 要使用的CodecID为S_TEXT/WEBVTT。 CodecPrivate:全局WebVTT块的存储 该元素包含第一个字幕条目之前的所有全局块。它从“ WEBVTT”文件标识标记开始,但不包括可选的字节顺序标记。

    2K10编辑于 2022-11-04
  • 来自专栏媒矿工厂

    WWDC2023 | 如何为visionOS准备和提供视频内容

    与视频和音频编码类似,应该生产HLS支持的字幕文件和格式,最常见的是WebVTT。 媒体的打包 打包是将源媒体转换为各种类型的段以进行可靠交付的过程。 对于目标段持续时间,源 WebVTT 文件可以拆分为任意数量的 WebVTT 文件。 2D媒体的生产与交付 2D媒体的生产和交付流程包括编码、打包,以及通过HTTP进行交付。

    56810编辑于 2024-02-29
  • 来自专栏javascript学习笔记

    CSS伪元素的基本使用

    color: red } .item::after { content: '*'; color: red } 二、::before 略 三、::cue 匹配所选元素中的WebVTT

    1.5K00编辑于 2022-03-04
  • 来自专栏AgenticAI

    肝了4天,我用ChatTTS和LLM让deeplearning.ai课程说上流畅中文

    字幕文件是WEBVTT(Web Video Text Tracks)格式,常用于web前端加载。 WEBVTT格式: WEBVTT 1 00:00:02.080 --> 00:00:05.660 Retrieval Augmented Generation, or RAG, has become a 1 00:00:02,080 --> 00:00:05,660 Retrieval Augmented Generation, or RAG, has become a key 使用FFmpeg将WEBVTT 字幕文件转换为SRT文件: ffmpeg -i subtitle.vtt subtitle.srt 但是我发现转换后第一行字幕被移除了,这是因为VTT文件的第一行包含"WEBVTT",被识别为非字幕块 我们仍然需要字节写代码移除第一行WEBVTT

    1.5K10编辑于 2025-03-18
  • 来自专栏媒矿工厂

    纵观OTT服务中的视频工程

    有两种流行的标准来表示这些字幕——SRT 和 WebVTT。 字幕和隐藏式字幕(Closed Captions)之间有非常细微的区别。 在“打包”阶段,对 WebVTT 的引用被添加到 HLS 和 DASH 清单文件中。 每一项技术,无论它看起来多么简单--如果你以正确的方式采用它,就有机会实现差异化。

    1.1K30发布于 2021-07-06
  • 来自专栏媒矿工厂

    Demuxed 2019 演讲视频选(十三)

    a93e34d3dab9dad31fed2bd8611b5d78&dis_t=1578993604 第二场演讲的演讲者是来自Seven West Media Australia的Jeremy Brown,演讲主题是”WebVTT

    62210发布于 2020-01-14
  • 来自专栏嵌入式音视频

    【Airplay】WWDC学习_苹果开发者大会

    我们推荐第二种方式 但你可以使用两者 最后 我们讲下其他要求 如果你要使用HDR内容 最好的方式是 提供多种格式类型 比如Dolby Vision和HDR 10 因为TV可能只支持 其中一种格式 使用WebVTT 添加字幕 所有网络内容 我们都推荐 都使用MIME格式 下面我们来讲下具体 细节 我们使用MIME格式 发送HLS播放列表很长时间了 关于视频和音频的 MIME格式推荐 可能是你想要了解的 请留意 对于WebVTT 我们使用text/plain 尽管WebVTT文档 推荐text/VTT格式 然而text VTT格式 并不是由IANA注册 也可能不被一些客户端兼容 所以要使用text/plain格式 下面是 一些不太常用的

    1.2K10编辑于 2023-04-07
  • 来自专栏媒矿工厂

    进度条滑动预览的四种方式

    后来,开发者发现,用于字幕传输的WebVTT非常适合该项任务,而由于此前使用的Sprite API和VTT有许多相似之处,开发者很快实现了使用VTT Playlist。

    2.2K20发布于 2021-03-25
  • 来自专栏媒矿工厂

    演进中视频流媒体容器格式与传输协议

    一直以来,Apple使用基于文本的Web视频文本轨道(WebVTT)标准在HLS中隐藏字幕(Figure4),并可能继续使用它。 ? 图4 DASH可以使用WebVTT,但也使用称为Timed Text Markup Language Profiles for Internet Media Subtitles and Captions 因此,CMAF支持WebVTT和IMSC-1格式。 ? 图5 对于DRM,CMAF支持通用加密(CENC,Common Encryption),它可以将多个DRM合并到一个包中。

    4K30发布于 2018-07-26
  • 来自专栏刘悦的技术博客

    口播神器,基于Edge,微软TTS(text-to-speech)文字转语音免费开源库edge-tts语音合成实践(Python3.10)

    Downloads edge-tts --voice zh-CN-XiaoyiNeural --text "你好啊,我是智能语音助手" --write-media hello_in_cn.mp3 WEBVTT import asyncio import edge_tts TEXT = "这里是语音流测试" VOICE = "zh-CN-XiaoyiNeural" OUTPUT_FILE = "test.mp3" WEBVTT_FILE submaker.create_sub((chunk["offset"], chunk["duration"]), chunk["text"]) with open(WEBVTT_FILE

    5.7K20编辑于 2023-03-09
  • 生成式引擎优化(GEO)避坑指南:从认知到实践的全面纠偏

    技术原理:豆包等平台对短视频的引用权重高于纯文本,其视觉解析系统可识别WebVTT格式的字幕时间轴与文本对应关系。避坑方案:视频优化:添加字幕、章节标记、关键帧描述,使用WebVTT格式标注时间轴。

    1.2K10编辑于 2025-09-01
  • 来自专栏前端食堂

    2020年你不应该错过的CSS新特性

    : The Web Video Text Tracks Format(https://w3c.github.io/webvtt/#the-cue-pseudo-element) 模块中的。 具体的作用: ::cue伪元素(不带参数)匹配元素构造的任何WebVTT节点对象列表,但与背景符号对应的属性必须应用于WebVTT线索背景框,而不是WebVTT节点对象列表 ::cue(selector ::cue { color: white; background-color: hsl(0 0% 0% / 90%); } 说实话,没有完全阅读 WebVTT: The Web Video Text Tracks Format(https://w3c.github.io/webvtt) 模块所有内容,对其并不完全了解。 这里只是做一个抛砖引玉的作用,如果你的工作内容和WebVTT相关,那应该对你会有一定的作用;如果你对这方面感兴趣的话,可以深挖这方面的知识。

    1.4K41发布于 2020-11-02
  • 【GEO优化助手】GEO优化实践中有哪些关键的技术难点需要重点培养

    技术原理:豆包等平台对短视频的引用权重高于纯文本,其视觉解析系统可识别WebVTT格式的字幕时间轴与文本对应关系。 优化要点:字幕与时间轴:为视频添加WebVTT格式字幕,标注关键节点(如“02:15 实测降噪效果”)。语义标签:使用YOLOv8模型进行物体检测,标注“120Hz刷新率”“OLED屏幕”等技术参数。

    78910编辑于 2025-09-03
  • 来自专栏Gnep's_Technology_Blog

    HLS直播协议详解

    HLS 中,索引文件可以嵌套,一般只有一级索引和二级索引; 媒体流封分片装格式只支持 MPEG-2 传输流(ts)、WebVTT[WebVTT]文件或 Packed Audio 文件。 EXT-X-MAP:表示 Media Segment 的头部信息,比如 PAT/PMT 或者 WebVTT 头。

    2.9K10编辑于 2023-10-29
  • 来自专栏DotNet NB && CloudNative

    多模态RAG应用之实现文本检索视频内容

    v=33bZIOLX4do 大家自行下载视频到本地,有很多在线下载工具的,如:https://yt1d.com/en12/ 先提取视频字幕 captions.vtt WEBVTT 00:00:00.120 # load video using cv2 video = cv2.VideoCapture(path_to_video) # load transcript using webvtt trans = webvtt.read(path_to_transcript) # iterate transcript file # for each video

    70610编辑于 2025-01-07
  • 来自专栏韩曙亮的移动开发专栏

    【FFmpeg】ffmpeg 命令行参数 ② ( Windows 环境中 ffmpeg 命令行输出文本搜索 -findstr 用法 | -findstr 搜索文本字符串用法 | 输出命令行到文件中 )

    subtitle S..... text Raw text subtitle S..... ttml TTML subtitle S..... webvtt WebVTT subtitle S..... xsub DivX subtitles (XSUB) 2、-findstr 搜索文本字符串用法

    1K10编辑于 2024-02-23
  • 来自专栏Java帮帮-微信公众号-技术文章全总结

    CSS Selectors Level 4新特性全面解析

    这里说的时间轴指的是例如WebVTT。 /> <track label="English" kind="subtitles" srclang="en" src="http://www.iandevlin.com/html5test/<em>webvtt</em>

    2.2K70发布于 2018-03-15
  • 来自专栏python爱好部落

    自动化剪视频

    Downloads edge-tts --voice zh-CN-XiaoyiNeural --text "你好啊,我是智能语音助手" --write-media hello_in_cn.mp3 WEBVTT

    84140编辑于 2023-09-01
领券