首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏音视频技术学习笔记

    视频技术3)- 入门DEMO

    image 推流的实现 推流的实现,需要先搭建一个nginx + rtmp服务器,也不复杂,网上有很多详细的教程 推流后,本地可以用ffplay来查看推流的视频,也可以写个简单的h5页面查看 document.getElementById('video'); var hls = new Hls(); hls.loadSource('http://xxxxx/hls/test2.m3u8 image.png iOS对音视频的支持非常好,写个播放的demo,总共不到80行代码 #import "PlayViewController.h" #import <MediaPlayer *urlStr = [[[NSBundle mainBundle]resourcePath] stringByAppendingPathComponent:@"resource.bundle/war3end.mp4

    1.3K20发布于 2020-03-27
  • Google Veo 3视频生成技术解析

    试用 Veo 3Google 推出的 Veo 3 在 AI 社区掀起热潮,这并非没有原因。核心技术能力使用 Veo 3,不仅可以生成视觉效果,还能生成原生音频,包括音效、环境噪声和对话。 技术亮点:口型同步与游戏世界生成Veo 3 还内置了精准的对话和口型同步功能:此外,我们发现其一项引人注目的能力:生成视频游戏世界。这对游戏开发领域具有重要影响。该模型提供了无限的探索空间。 提示词工程技术指南Google 已与我们分享了 Veo 3 提示词指南。 总结Veo 3视频生成领域的一次飞跃。原生音频、更强的提示词遵循能力以及逼真的运动,使该模型展现出惊艳效果。 无论是编写对话脚本、探索游戏世界还是突破电影摄影边界,Veo 3 都开辟了广阔的创作空间。提示词从此开始。欢迎在 Discord 上与我们交流,或在 Twitter X 上展示您的视频

    200编辑于 2026-06-10
  • 来自专栏全栈程序员必看

    3D视频编码(3d打印技术介绍)

    3D-HEVC编码框架 3D-HEVC编码结构是对HEVC的扩展,每个视点纹理及深度图编码主要采用HEVC编码框架,但在其基础上增加了一些新的编码技术,使其更有利于深度图和多视点的编码。 图1 3D-HEVC编码结构 如上图所示,3D-HEVC编解码结构和MVC类似。图中所有输入的视频图像和深度图像是同一时刻,不同拍摄位置的场景,这些图像组成一个存取层。 原理上来说,每个视点的图像,包括视频图像和深度图像,均可以利用HEVC编码框架进行编码,输入的所有比特流复合形成3D比特流。 非独立视点编码技术 3D-HEVC在编码非独立视点时,除了使用独立视点编码所用的所有工具外,还用到了HEVC关于3D扩展的编码技术,使其更有利于多视点的编码。 深度图编码 一般而言,所有用于视频图像的编码技术均可用作深度图编码,但是HEVC的设计目的是视频序列编码最优,对深度图的编码并不是最优。

    1.7K10编辑于 2022-07-29
  • 来自专栏Cellinlab's Blog

    视频技术快览 0x3 - 视频封装与播放

    FLV Header(9 字节) Signature - 前 3 个字节是文件的标识,固定是 FLV Version - 第 4 个字节表示版本 Flags - 第 5 个字节是一些标志位 第 6 # 音视频同步的类型 视频同步到音频(最常用的音视频同步方式) 指音频按照自己的节奏播放,不需要调节 如果视频相对音频快了的话,就延长当前播放视频帧的时间,以此来减慢视频帧的播放速度 如果视频相对音频慢了的话 Payload 1.6 将封装后的 RTP Payload 打包为 RTP 包 1.7 将 RTP 包进一步打成信令数据包 1.8 将此信令数据包通过信令通道发送到服务端 要注意的是,这里的第 3 OpenH264 模块进行解码,得到 YUV 格式的单帧图像 2.4 将单帧 YUV 图像转为 RGBA 格式的图像 2.5 通过 Canvas API 将 RGBA 格式的图像绘制到画布中 这里的第 3 Chrome 浏览器率先实现了基于 W3C 的 WebTransport 和 WebCodecs 规范 WebTransport 进一步优化了媒体传输通道,而 WebCodecs 规范则定义了浏览器所提供的更底层的媒体编解码接口

    79420编辑于 2023-05-17
  • 来自专栏跟铭哥学音视频技术

    视频技术基础(六)-- 3A处理

    今天带大家看看音频数据处理的方法3A处理。 简介 前面我们有学到,音视频数据的处理过程有个预处理过程,也就是在音视频数据采集完成之后的一步,音频的预处理就是用的3A处理,3A即AEC、ANS、AGC。

    11.2K74发布于 2020-07-12
  • 来自专栏视觉大数据

    3Dforce步态识别技术帮你解码视频大数据

    随着高清IP摄像机的普及,视频监控系统平台的视频接入和存储也越来越多,如何有效利用这些视频资源,挖掘其潜在价值,是用户当前面临的首要问题。 这一切的前提都依赖于智能算法、数据挖掘技术不断突破和成熟。盈力科技步态识别技术的应用,为海量视频数据的深度挖掘提供了一个新的技术手段。 近年来,随着人工智能技术的飞速发展,应用于公安行业的人工智能技术越来越多,如人脸识别技术视频结构化技术、盈力3dforce步态识别技术等让公安视频侦查如虎添翼。 与其他的生物识别技术相比,步态识别具有非接触、远距离、不容易伪装等优点,能够利用目标人员的身高体态、运动模式等特征,从海量视频中快速搜索出与样本高度相似的目标或视频片段,从而达到在换装、跨场景、面部遮挡的情况下 与其他的生物识别技术相比,步态识别具有非接触、远距离、不容易伪装等优点,能够利用目标人员的身高体态、运动模式等特征,从海量视频中快速搜索出与样本高度相似的目标或视频片段,从而达到在换装、跨场景、面部遮挡的情况下

    80740发布于 2019-05-15
  • Veo2与Imagen3视频图像生成技术

    使用Veo 2和Imagen 3实现先进的视频与图像生成Veo 2:最先进的视频生成Veo 2能够创建涵盖广泛主题和风格的高质量视频。在与领先模型进行的人工评估对比中,Veo 2取得了最先进的结果。 视频模型常产生“幻觉”(如多余手指或意外物体),Veo 2较少出现此类问题,使输出更真实。安全与负责任开发的理念指导了Veo 2。 Imagen 3:最先进的图像生成改进后的Imagen 3图像生成模型能够生成更明亮、构图更佳的图像,能以更高精度呈现从写实到印象派、抽象到动漫等多种艺术风格。 在与领先图像生成模型的人工对比评估中,Imagen 3达到了最先进水平。即日起,最新Imagen 3模型将在Google Labs的图像生成工具ImageFX中向100多个国家全球推出。 在底层,Whisk结合了最新的Imagen 3模型与Gemini的视觉理解和描述能力。Gemini模型自动为用户的图像编写详细的标题,然后将这些描述输入Imagen 3

    11810编辑于 2026-04-10
  • 来自专栏smy

    视频技术基础

    在线直播可以说从去年开始变成了一个火爆的创业领域,一下子出来了很多做视频直播的公司。但说实话这方面的技术书籍实在是非常的少,网上的资料也很零散,所以我决定写一些列介绍视频技术的文章。 今天这篇文章先对视频技术中的基础概念做一些简单的总结。 你所能看到的视频 现在可能大部分人都直接用浏览器在视频网站上看视频了,已经不太能看到视频的后缀名之类的东西了。 同样音频编码和视频编码一样,指的是通过一定的手段将音频数据进行压缩。音频数据在视频文件中占用空间跟视频数据比非常的小,我们这里就不重讨论,目前主要的音频编码格式有AAC、AC-3、MP3、WMA。 音频的压缩编码标准包含AAC,MP3,AC-3等等,视频的压缩编码标准则包含H.264,MPEG2,VC-1等等。解码是整个系统中最重要也是最复杂的一个环节。 本文大部分内容抄自[总结]视音频编解码技术零基础学习方法,一部分来源于自己的总结《[总结]视音频编解码技术零基础学习方法》应该是国内视频领域最系统的学习资料了。有兴趣的朋友可以去仔细阅读一下。

    1.5K20发布于 2019-01-03
  • 来自专栏ThoughtWorks

    3分钟视频 | 我们在技术雷达峰会聊什么?

    5月13日,由ThoughtWorks主办的2017技术雷达峰会在北京圆满落下帷幕。 我们用1天时间,呈现了13个精彩话题,主要围绕以下三大主题: 最新卷技术雷达解析——技术热点全局认识,了解现在的趋势 从业务与管理视角技术趋势给当今企业带来的影响 具体落地、技术实践 2017技术雷达峰会日程 活动当天近300名来自不同行业的高管、资深技术大牛出席,拥有10年以上工作经验的参会者比例高达64%。 活动现场 ? 根据参会者们的反馈,小编特别推荐以下三个满载干货与诚意的最受欢迎话题给大家。 回到主题,说好的3分钟视频在这里。 3分钟了解技术雷达峰会 ? 更多演讲话题的视频将在本周内陆续上线,未来几周内,ThoughtWorks社区活动中会有更多和技术雷达相关的话题开讲。 最后小编想说,通过对参会者们的调查,我们发现以下三大方面最受大家关注: TOP1 微服务 TOP2 人工智能 TOP3 数字化转型 那你呢?请投票~

    84960发布于 2018-04-17
  • 来自专栏媒矿工厂

    《高动态视频技术

    《高动态视频技术》由上海交通大学媒体技术实验室编著,面向图像与视频处理领域HDR技术的研发人员、技术爱好者以及相关专业的本科生、研究生。 我们从HDR技术的基础知识开始,通过整理与总结现有的HDR相关标准,相关技术文档,完成了本书11个章节的编纂。 本书主要分为三个部分:HDR技术基础、HDR处理技术以及HDR编码方案,具体目录如下: 第一部分--HDR技术基础 第一章-光学与人类视觉感知特性基础 第二章-光电转换与HDR图像显示 第三章-色度学与颜色空间 的HDR编码优化 第十一章-HEVC/H.265的HDR编码方案 近年来,HDR技术以及相关的HDR显示设备,HDR视频制作与传输等产业与技术都在不断发展并日趋成熟,但是与HDR技术相关的理论背景以及相关技术介绍与总结却并不多 ,因此我们希望能够在本书中将HDR发展过程中的理论与技术,以及截至2018年的最新技术与相关成果尽可能地展现给读者,帮助读者更好地了解与研究HDR技术

    2.3K41发布于 2019-03-07
  • 视频技术入门指南

    本文翻译自我的英文博客,最新修订内容可随时参考:视频技术入门指南 你真的理解视频技术吗?什么是帧率、分辨率、码率?它们之间有什么关系?你知道“1080p”和“4K”中的“p”和“K”代表什么吗? 为什么视频文件有.mp4、.mkv、.flv 等多种后缀? 本文将从基础概念入手,带你系统理解视频技术的核心要素。 一、基础概念:存储与带宽 1. 3. 宽高比(Aspect Ratio) 定义:画面宽度与高度的比例,常见比例: 16:9(高清视频、电影); 4:3(传统电视、老电影); 21:9(超宽屏电影)。 3. 如需深入探讨编码参数调优或设备性能分析,欢迎访问博客获取更多技术细节:视频技术入门指南。

    1.5K10编辑于 2025-06-06
  • 来自专栏跟铭哥学音视频技术

    视频技术基础(一)--音视频技术概念基础

    最近开始学习TRTC实时音视频技术,我会记录并分享我的一些学习心得和体会,欢迎各位大佬来一起交流指正。 在开始正式学习TRTC之前,还是需要先了解一下音视频技术,这样可以方便以后的学习。 音视频技术介绍 什么是音视频技术?音视频技术其实就是音频技术视频技术的一个统称,在技术处理上,其实音频和视频是要分开处理的。 在这个阶段其实就是对音视频进行修剪操作,毕竟收集到的原始数据,不一定是想要在最后呈现的效果,因此在这里可能会进行美颜、裁剪、AI识别处理、声音A3处理等; 3. 编码。 image.png音视频参数 音视频主要参数即格式 视频参数: 1. 分辨率:视频面积大小(像素px); 2. 帧率:每秒的帧数量fps; 3. 码率:每秒的数据量bps(b = bit)。 音视频同步的算法如下图所示: image.png 流媒体协议 通常音视频数据体积比较大,所以在网络传输过程中都是连续不断的多媒体流量,在网络中传输音视频数据的技术叫流媒体技术,传输使用的协议就是流媒体协议

    6K156发布于 2020-06-16
  • 来自专栏LiteMedia

    介绍安防监控视频技术的发展及LiteCVR视频技术

    随着科技的不断发展,安防监控视频技术也在日新月异地进步。从最初的模拟视频监控到数字视频监控,再到现在的网络视频监控和智能视频监控,安防监控视频技术经历了漫长的发展历程。 此外,智能视频监控技术的出现也推动了安防监控视频技术的进一步发展。 二、安防监控视频技术的应用场景安防监控视频技术广泛应用于各个领域,如金融、交通、能源、教育等。 三、安防监控视频技术的未来发展趋势随着科技的不断发展,安防监控视频技术还将继续发展和进步。 3.网络化:随着网络技术的不断发展,网络视频监控将继续成为安防监控领域的重要发展方向,实现更高效、更灵活的视频传输和存储等功能,提高安防监控的效率和范围。

    68910编辑于 2023-11-10
  • 来自专栏音视频直播技术专家

    「音视频直播技术」iOS视频采集

    前言 前两天给大家介绍了如何在iOS下进行音频采集,今天介绍一下在iOS下进行视频采集。 要了解iOS是怎样进行视频采集的,首先我们要了解 AVCaptureSession, AVCaptureDevice等几个基本概念及iOS上视频采集的工作原理。 AVCaptureVideoDataOutput AVCaptureVideoDataOutput是录制视频和访问视频帧的输出。它继承自 AVCaptureOutput。 根据视频类型 AVMediaTypeVideo,创建 AVCaptureDevice 对象。(可以创建视频设备也可以创建音频设备)。 小结 我们首先介绍了在iOS进行视频采集的一些基础概念,然后又通过分析 WebRTC 代码了解了视频采集的基本步骤(共 12 步)。

    4K40发布于 2020-04-02
  • 来自专栏即时通讯技术

    视频直播技术干货(十一):超低延时视频直播技术的演进之路

    》 《视频直播技术干货(八):淘宝高清、低延时的实时视频直播技术解密》 《视频直播技术干货(九):千万级直播系统后端架构设计的方方面面》 《视频直播技术干货(十):一文读懂主流视频直播系统的推拉流架构、 传输协议等》 《视频直播技术干货(十一):超低延时视频直播技术的演进之路》(* 本文) 3、低延时直播技术的作用 网络基础设施升级、音视频传输技术迭代、WebRTC 开源等因素,驱动音视频服务时延逐渐降低 3 到 7 秒。 3)单向传导的局限第一个方面表现在:观众端拉流传输无法做到根据网络情况自适应调节。 如电商直播、赛事直播等场景,兼具高并发与低延时的特性,传统直播 3-20s 的时延难以满足其需求,但对实时互动的要求又不及视频会议等典型的实时音视频应用,无需将时延降低至 400ms 以下。

    4.9K11编辑于 2024-01-04
  • 来自专栏CreateAMind

    autoware 视频展示3

    Public Road Demonstration Instruction Videos Quick Start Loading Map Data more : autoware 自动驾驶展示视频

    47020发布于 2018-07-24
  • 来自专栏音视频直播技术专家

    视频直播技术--视频渲染之EGL

    前言 我们在Andriod系统下做视频渲染时要使用 OpengGL ES, 而使用 OpengGL ES 就不得不提到 EGL。那么EGL是什么呢?它又在渲染时起到什么作用呢? 下图展示了 EGL 在视频渲染中的作用: ? Display(EGLDisplay) 是对实际显示设备的抽象。

    2.4K30发布于 2020-04-02
  • 来自专栏音视频直播技术专家

    视频直播技术--视频画中画

    视频 前言 大家好,今天我为大家介绍一下如何在Android系统下实现实时直播互动中的多视频展示功能。 我们现在都清楚实时直播互动中多路视频的展示是目前比较流行的趋势,因为大家都想看到更多视频画面的需求,是非常符合人类的习惯的。 大家都知道,在Android系统下显示视频主要有三种View,分别是SurfaceView、GLSurfaceView及TextureView。 它们的区别大家可以看我的另一篇文章 视频的渲染与展示 一文的介绍。我们今天这个例子是通过 SurfaceView来给大家演示的。 技术实现 在资源文件中定义两个 SurfaceView <RelativeLayout xmlns:android="http://schemas.android.com/apk/res/android

    2.5K10发布于 2020-04-02
  • 来自专栏音视频直播技术专家

    视频直播技术--Android视频采集(Camera1)

    camera1.jpg 前言 今天为大家介绍一下使用Camera1进行视频采集。之前我写过一篇文章介绍的是Camera2进行视频采集。那么有人会问,为什么有了Camera2还要介绍Camera1呢? 这里最主要的原因是因为Android版本众多,Camera2是Google新推出的视频采集架构,但很多老的机型还不支持,所以为了兼容性的问题,我们还不能放弃使用Camera1进行视频的采集。 3. 设置参数。 ...... 3. 将生成的纹理设置到Camera中。 4. 开启预览。5. 当有视频帧到达后,使用OpengGL ES绘制图片。 ...... 参考 视频渲染之EGL Android视频采集Camera2 http://www.jianshu.com/p/39a015f2996e ----

    6.2K41发布于 2020-04-02
  • 来自专栏音视频咖

    技术解码 | 腾讯云视频插帧技术

    本期的技术解码 为大家带来腾讯云视频插帧技术的详细解析 随着信息科技与互联网技术的高速发展,视频已逐渐成为人们获取信息的重要来源。 视频帧率增强的视频插帧 Video Frame Interpolation 技术,又称帧速率转换(Frame Rate Conversion)技术,是通过在原始视频的每两帧画面中增加一帧或多帧,缩短帧与帧之间的显示时间 ,是视频插帧技术中的关键。 总体而言,目前视频插帧方案在视频存在大位移、复杂运动等问题时插帧产生的伪影依然十分严重,主要面临的挑战有: 1. 运动幅度大产生的形变 2. 光流估计的准确性 3. 非匀速运动 4.  图3 光流估计效果 插帧效果演示如下: 可以看出,腾讯视频云团队的插帧整体方案能够很好地提升视频的帧率,实现更加流畅和丝滑的播放效果,且在大位移、复杂运动中也表现优异。

    3.5K20发布于 2021-04-15
领券