首页
学习
活动
专区
圈层
工具
发布

#视频

文本、图像、视频、语音统一推理——vLLM-Omni 用 Stage 抽象重新定义全模态引擎

用户7411420

vLLM 官方的全模态推理引擎——在 75K Star 母项目的地基上,通过 Stage 抽象和完全解耦执行,将 LLM 自回归推理、Diffusion 图像/...

1500

被知识管理劝退过?微信里转发一下就行了

Dawson聊AI提效

之前用的是Obsidian的messenger插件,我还写过推文介绍。这玩意挺好的,把微信公众号文章的链接丢过去,它就能把全文提取到笔记里。用了个把月,觉得还挺...

1000

Sora2水印批量去除神器!开源免费+本地运行,批量处理AI视频

阿坡RPA

随着OpenAI Sora2的惊艳亮相,AI视频创作进入了新纪元。但Sora生成的视频自带的官方水印,让创作者们在进行二次剪辑时很头大。如何才能完美去除这个水印...

3000

RealPLC的演示宣传PPT?不!直接上html!

Hello工控

不知道大家还在写PPT没?最近的一份PPT来自于我们RealPLC感兴趣的朋友提出的需求,问我们能不能提供关于RealPLC的产品介绍文档或者视频!

5200

京东开源 JoyAI-Echo:5 分钟长视频角色不崩,对话式编辑彻底告别视频开盲盒!

开源星探

而 JoyAI-Echo 的出现,彻底打破了这个僵局。它不仅能生成最长 5 分钟的连续故事视频,角色身份、视觉形象和声音音色在整个过程中都能保持高度一致;更让人...

34740

继公众号、视频号之后,腾讯ima知识号是下一个内容红利吗

克劳德2048

公众号成就了自媒体,视频号成就了短视频创作者。腾讯ima知识号以知识库为核心,正在开辟"知识内容"的新赛道,它会是下一个红利入口吗?

9510

HTML版剪映来了!Open Design 团队最新开源力作,3天时间,写了3万行代码!

开源星探

过去,要做出一支像样的产品宣传视频或者知识解说视频,你需要专业的剪辑师、动画师、配音员,可能还要花几万块钱找外包团队。

22110

Agnes AI + ArcReel + O4OpenAI:我搭了一套零成本的 AI 视频生成流水线

javpower

试了一圈下来,还真让我拼出来了。核心就三个东西——Agnes AI 提供免费 API,O4OpenAI 做协议转换,ArcReel 当创作工作台。三个项目串起来...

25910

NVIDIA-OpenCode-免费模型使用指南

zeekling

查询当前可用免费模型列表: https://build.nvidia.com/models?filters=nimType%3Anim_type_previe...

29910

世界模型四大技术路线深度研究清单

勇哥AI笔记

而语言大模型从底层基础,技术架构上就不支持这点,比如 Sora 生成的视频就发现过不遵守物理规则的现象。

22610

AI早报 | 6月5日:DeepSeek 500亿融资启航,微软MAI亮剑,字节Bernini开源,全球AI治理加速

小博测试成长之路

传统AI视频生成的最大痛点是不可控——画面抖动、主体变形、指令落地偏差。Bernini用"双段式"架构从根本上解决了这些问题,让AI视频编辑从"抽卡碰运气"升级...

50310

文本、图像、视频 API 全部免费开放,这家平台想把多模态门槛直接踩平

轻松玩K技

文本模型主要面向多轮对话、代码、Agent 工作流和工具调用;图像模型支持文生图、图生图;视频模型支持文生视频、图生视频和关键帧动画。

67912

文本、图像、视频 API 全部免费开放,这家平台想把多模态门槛直接踩平

轻松玩K技

文本模型主要面向多轮对话、代码、Agent 工作流和工具调用;图像模型支持文生图、图生图;视频模型支持文生视频、图生视频和关键帧动画。

67912

别让 AI 把你气哭:2026年 DeepSeek-V4 提示词终极指南

90后小陈老师

今天这篇文章,就以目前国内创作圈公认的卷王 DeepSeek-V4 为示范模型,把所有提示词的核心秘密一次性讲透。不管你是写网文、做小红书、剪视频脚本,还是对编...

23510

视频平台带宽成本一年吃掉几千万?这样做可以砍一半

hollyx

摘要 视频平台带宽支出常年居高不下,是吞噬利润的隐形黑洞。借助 H.265/H.266/AV1 新一代编码与超高清实时处理能力,在画质不变前提下显著压低码率,平...

9810

智能电视、机顶盒、车机端侧视频 SDK 集成方案

hollyx

智能电视、机顶盒、车机等消费电子设备对端侧视频处理能力要求高。腾讯云媒体处理企业版(MPSE)提供可深度集成的视频 SDK,支持极速高清转码、自适应码流与 H....

8010

视频数据不能出域?私有化媒体处理的 3 种合规架构

克劳德2048

广电、政务、金融、医疗、能源等行业的视频数据普遍要求不出域,但媒体处理能力又必须跟上。围绕本地机房、混合云、专有公有云三种部署形态,可以构建符合合规要求又具备企...

11510

老视频画质模糊?云端 AI 修复到底能做到什么水平

hollyx

先说能做的部分。基于深度学习的视频画质修复目前在工程上已经比较成熟,常见能力包括:

13110

视频网站 / OTT 平台转码架构实战:从推流到分发的全链路

hollyx

视频网站与 OTT 平台对转码架构有极高要求。腾讯云媒体处理企业版(MPSE)提供专有云加 SDK 交付,覆盖主流格式、多分辨率多码率、高清低码与流程编排能力,...

10910

视频转码总是慢、总是超时?可能是你的集群架构出了问题

克劳德2048

任务接收、转码执行、结果回写,每一层都要能水平扩展。一份长视频可以被拆成多个分片在不同节点上并行处理。MPSE 长视频最高支持 30 倍速分布式转码——一部 2...

15710
领券