首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏音视频技术修炼手册

    视频里的I、P、B是什么?

    什么是I、P、B?I:intra picture,内编码。 I特点:1)I是一个全压缩编码;2)解码时仅用I的数据就可重构完整图像;3)I描述了图像背景和运动主体的详情;4)I不需要参考其他画面而生成;5)I是P和B的参考(其质量直接影响到同组中以后各的质量 );6)I组GOP的基础(第一),在一组GOP中只有一个I;7)I不需要考虑运动矢量;8)I所占数据的信息量比较大。 I或P;4)P可以是其后面P的参考,也可以是其前后的B的参考;5)由于是差值传送,P的压缩比较高。 IDR也是I的一种,那么IDR与普通I有何区别呢?一个IDR之后的所有都不能引用该 IDR 之前的的内容;而对于普通的I,其后的P和B可以引用该普通I之前的其他I

    2.8K11编辑于 2024-11-14
  • 来自专栏Visual Codex

    视频编码的三种:I,B,P

    在视频压缩编码中,所有的被分成了三个种类,I,B和P,其实就是Intra-Prediction,Bi-prediction和Prediction。 顾名思义,就是内预测,双向预测以及(单向)预测。 (inter prediction),内预测的话就是在找参照块的时候,只在当前内寻找;而间预测的话,找参照块的时候会在相邻的之间去找相似块。 因此,基于上述所说, 如果说当前是只在当前内寻找参照块的话,那么该就是I 如果在已经编码的里面寻找参照块的话,那么它是P 如果既在已编码的里去寻找参照块,又在未来将要被编码的里去寻找参照块的话 ,那么该就是B

    2.9K20发布于 2021-02-24
  • 来自专栏腾讯IMWeb前端团队

    视频中的 I ,P ,B

    由于压缩处理的方式不同,视频中的画面就分为了不同的类别,其中包括:I 、P 、B 。I 是内部编码(也称为关键),P 是前向预测(前向参考),B 是双向内插(双向参考)。 简单地讲,I 是一个完整的画面,而 P 和 B 记录的是相对于 I 的变化。如果没有 I ,P 和 B 就无法解码。 I I (Intra coded frames):I 图像采用内编码方式,即只利用了单图像内的空间相关性,而没有利用时间相关性。 由于 I 不依赖其它,所以是随机存取的入点,同时是解码的基准。 I 主要用于视频播放的初始化,I 图像的压缩倍数相对较低。I 图像是周期性出现在图像序列中的,出现频率可由编码器选择。 P 是差别,P 没有完整画面数据,只有与前一的画面差别的数据。 若 P 丢失了,则视频画面会出现花屏、马赛克等现象。

    5.2K20编辑于 2022-06-29
  • 为什么叫

    ”这个词在中文里通常是“frame”的翻译,出现在计算机网络、音视频处理、操作系统等多个技术领域。它之所以叫“”,是因为它有“一整块结构化数据”的含义,像一张照片、一张画框,代表某个完整的单位。 在网络通信中:(Frame) 是数据链路层传输的基本单位,通常包括: 头(Header):比如目标地址、源地址 数据(Payload):实际传输的内容 尾(Trailer):比如校验信息(CRC ) 为什么叫? 在音视频中: 视频(Video Frame):一张静止图像,多个连在一起就是视频。 音频(Audio Frame):一小段音频数据。 同样的原因叫“”,因为每一是一个可以单独处理、播放的完整单元。总结一句话: (Frame)是指一组结构完整、边界清晰、可以独立传输或处理的数据单位。

    68110编辑于 2025-08-26
  • 来自专栏人人都是极客

    音频、视频及其同步

    今天介绍下音频、视频的主要参数和分析方法,以及音视频的同步等,主要内容如下: 音频 视频 PTS与DTS 音视频同步 音频 音频的概念没有视频那么清晰,几乎所有视频编码格式都可以简单的认为一就是编码后的一副图像 大小 大小指每的采样数,这个值的恒定的,具体如下: ? 采样率 可以从 MPEG 音频头 10~11 位获取采样率,单位 Hz,参考如下: ? P :前向预测,表示与前一(I 或 P )之间的差别,需要参考前面的 I 或 P 才能生成完整的图片,相较 I 更具压缩性,节省了空间,所以 P 也成为增量。 上图中显示的顺序为: 1I1、B2、B3、B4、P5、B6、B7、B8、P9、B10、B11、B12、I13 编解码顺序为: 1I1、P5、B2、B3、B4、P9、B6、B7、B8、I13、B10、B11

    5.3K10发布于 2021-02-08
  • 来自专栏音视频技术

    Easy Tech:什么是I、P和B

    I、P和B Easy-Tech #002# 在本篇文章中,我们将学习I、P和B的工作原理以及它们的用途。 好,我们先从现代视频压缩中最基本的概念开始——内预测和间预测。 现在,看完对内预测和间预测的快速介绍,让我们来学习I、P和B吧! 什么是I? 想要理解B的作用,我们需要先理解呈现/显示顺序和解码顺序的概念。 以I和P为例。如果你只使用这两种类型的,那么每一要么参考自身(I ),要么参考前一(P )。 参考B和非参考B 我们在上文中学过,B可以参考两或者多,通常,(根据其位置)一在前,一在后。我们也已知道,I不参考任何,P只参考前面的。 那么问题来了——任何都能使用B作为它的参考吗? 答案是肯定的。 如果B可以作为参考,它就被称为参考B。 如果B不用作参考,它便被称为非参考B

    4.2K20发布于 2021-09-23
  • 来自专栏韩曙亮的移动开发专栏

    【音视频原理】视频的 I P B 概念 ① ( 码率 帧率 分辨率 视频信息 | I - 内部编码 | I - 关键压缩法 | P - 前向预测 )

    of Pictures ) 的 第一 , 画面组 内 还有 P 和 B ; I 是 P 和 B 的 参考 ; I 的 质量 决定了 同组 P 和 B 解码后的 一系列 Frames ) " , 是 视频编码 中的一种 类型 , P 采用 前向预测编码方式 , 根据 本 ( P ) 与 相邻的 前一 ( I 或 P ) 的 不同点来压缩本帧数据 I 才能完成解码 ; P 只记录了 与 I 不同的内容 , 也就是 只有 与 I 的 差异部分 , 相同的部分没有 ; 解码 P , 必须 先解码 I ; I 解码完成后 , 将 I 与 P 合并 , 才能得到完整的 P ; 3、P 顺序不能颠倒 P 的 压缩效率较高 , 因为它 只 包含了 与参考 I 的差异数据 , 而不是完整的 画面帧数据 ; 由于 P 依赖于前面的 I 或 P , 因此在视频流中 , P必须按照正确的顺序进行传输和解码 , 否则会导致图像出现错误 ; 下图中 , P1 解码 依赖于 I , P2 解码 依赖于

    3K12编辑于 2024-01-24
  • 企业信ipad协议:语音通信零拷贝转码方案

    企业信ipad协议:语音通信零拷贝转码方案企业信在长连接通道内使用cmd=0x0602下发SilkV3语音,采样率固定16kHz,长20ms。为对接实时ASR,需在网关侧完成流式转码。 一、结构梳理解密后TLV序列如下:展开代码语言:TXTAI代码解释0x50duration2B0x51sampleRate2B//160000x52silkStreamNB//首字节=块长0x53aesKey16B 三、时间戳对齐利用头msgid高32位秒级UTC,与本地steady_clock偏差校正,ASR窗口误差<2ms,满足实时字幕需求。 展开代码语言:PythonAI代码解释#技术交流入口search="bot555666"通过官方外露字段实现零拷贝转码,既保持高吞吐,又降低端到端延迟,是企业信协议接口在语音场景下的关键优化路径。

    16910编辑于 2025-12-05
  • 来自专栏陶士涵的菜地

    布局

    /*******************2016年5月3日 更新**************************************/

    95020发布于 2019-09-10
  • 来自专栏sofu456

    本文链接:https://blog.csdn.net/daoer_sofu/article/details/103409744 头和数据重合 头、长度、尾重合 接受缓冲区越大,重合概率越小,可以不考虑 发送和发送数据转义(转义和头相同的数据),避免头和数据重合 参考:https://www.amobbs.com/thread-5656551-1-1.html?

    1.1K20发布于 2019-12-10
  • 来自专栏音视频技术修炼手册

    结合编码引擎,从视频编解码角度对Sora浅析

    作为视频编码行业的领军企业,非常关注AIGC的行业动态,Sora发布后,产研团队从编解码角度对Sora样例视频做了一系列的分析。 · 缘于编码技术,与OpenAI建立联系Sora目前对外展示的视频均为H.264标准视频,原因不言而喻,因其兼容性更高,能向所有用户展示研发成果。 基于以上分析,海外团队联系了 VP of Research at OpenAl 。 OpenAI表示,在目前Sora的初始阶段,主要精力投入在大模型优化改善上,视频编解码并非高优任务,也期望未来与进行详细的技术交流和合作探讨。 同样也非常期待,当“AI生成”与“视频传播”深度链接以后,能够与OpenAI共同探讨AI与视频编码的结合,一起探索创新。

    41610编辑于 2024-10-29
  • 来自专栏素质云笔记

    视频处理基本技术(取、合

    目前暂时更新 1 逐拆解 def video2frame(videos_path,frames_save_path,time_interval): ''' :param videos_path : 视频的存放路径 :param frames_save_path: 视频切分成之后图片的保存路径 :param time_interval: 保存间隔 :return: ''' + "/frame%d.jpg" % count) # if count == 20: # break print(count) 其中time_interval一般取1 2 合成视频 print(im_name) # break videoWriter.release() # print('finish') im_list:要合成视频,图片列表

    1.4K30编辑于 2022-11-16
  • 来自专栏txp玩Linux

    音视频基础知识(4):I、P、B、GOP

    一、H264类型定义: 在H264的编码中,通常以三种不同类型的来表示传输的画面,分别是I、P、B。 P:P指的是前向参考,它需要参考前一的图片才能够正确把数据解码出来。 B:B指的是双向参考,它需要参考前一数据和后一数据才能够正常把数据解码出来。 但是它也有自身的缺点,那就是I的体积比较大,假设在传输视频中全部采用I去传输,那整个网络链路都承受着巨大的压力。所以,I就要配合P、B等进行数据的传输。 P:P又称之为前向参考,此的特点是需要参考前一的图像信息才可以正确把图像解码出来。P指的是这一和前一的差别,并通过将图像序列中已经编码后的冗余信息充分去除来压缩传输数据量的编码图像。 B:B也称之为双向参考,B的特点是以前面的(I或者P)或者后面的(也是I、P)作为参考找出B的预测值,并且取预测差值和预测矢量进行传送。

    8.8K32编辑于 2022-11-28
  • 来自专栏小程序

    11-信小程序授权登录

    信小程序授权登录小程序可以通过信官方提供的登录能力方便地获取信提供的用户身份标识,快速建立小程序内的用户体系。 详见 用户信息功能页信 Windows 版:支持信 Mac 版:支持相关文档: 小程序登录、UnionID 机制说明、接口调用频率规范功能描述调用接口获取登录凭证(code)。 通过凭证进而换取用户登录态信息,包括用户在当前小程序的唯一标识(openid)、信开放平台账号下的唯一标识(unionid,若当前小程序已绑定到信开放平台账号)及本次登录的会话密钥(session_key https://developers.weixin.qq.com/miniprogram/dev/component/web-view.html优缺点对比: 小程序api开发 优点 显示、体验效果好 可使用的信资源 、接口丰富 响应速度快 缺点 开发方面,需要多开发一套项目 小程序自成一派,如有缺陷,解决起来费时费力 嵌入html5 优点 无需专门开发一套小程序版本项目 更新同步 开发速度快 缺点 能够使用的信资源受限

    2K10编辑于 2024-12-26
  • 来自专栏VNF

    MPEG4视频中,I、p、B的判定(转载) By HKL,

    mpeg4的每一开头是固定的:00 00 01 b6,那么我们如何判断当前属于什么呢?在接下来的2bit,将会告诉我们答案。 注意:是2bit,不是byte,下面是各类型与2bit的对应关系:   00: I Frame   01: P Frame   10: B Frame  为了更好地说明,我们举几个例子,以下是16 98 …… B 下面我们来分析一下为什么他们分别是I、P、B   0x10 = 0001 0000   0x50 = 0101 0000   0x96 = 1001 0100  大家看红色的2bit,再对照开头说的与2bit的对应关系,是不是符合了呢? break; case 0x80: //B Frame break; default: break; } From: http://www.360doc.com/content/11

    2K10发布于 2020-07-22
  • 来自专栏艺述论专栏

    信小程序分享11: label标签

    标签组件在weui中被用在了很多地方,主要用于为另一个组件提供说明性的文本。在小程序中,只有一个for属性,指示另一个组件的id。

    2.4K40编辑于 2022-03-08
  • 来自专栏twowinter

    LoRaWAN协议中文版 第11章 下行ping格式(仅Class B)

    本文作者twowinter,转载请注明作者:http://blog.csdn.net/iotisan/ ---- 翻译开始 第11章 下行 ping 格式(仅 Class B) 11.1 物理格式 下行 Ping 使用和 Class A 下行相同的格式,但必须采用一个不同的信道频率计划。 11.2.1 单播 MAC 消息格式 单播下行 Ping 的 MAC 载荷格式和 Class A 的定义一样。终端的处理也采用相同的方式。 同时也采用相同的计数,在收到 Class B ping 时隙或者 Class A 应答时隙时都进行递增处理。 11.2.2 多播 MAC 消息格式 多播和单播大部分都一样,仅有一些区别: 不允许携带 MAC 命令,既不能在 FOpt 字段里,也不能 port 0 时的载荷里携带,因为多播下行不像单播那样具备认证鲁棒性

    56930发布于 2020-04-17
  • 企业信ipad协议的结构设计与编码实践

    企业信ipad协议的核心技术特征,在于其将业务语义高度压缩于二进制结构的精巧设计。理解这一结构,是从“会用接口”迈向“理解协议”的关键门槛。 本文聚焦于企业信ipad协议的二进制格式,深入解析其头部定义、TLV编码规则与组包实践,为开发者提供可复现的技术参考。企业信ipad协议基于TCP长连接,采用私有二进制格式进行通信。 例如,一个包含发送方UIN、会话ID和消息内容的TLV序列可能如下组织:Type0x01:发送方UIN(8字节)Type0x02:会话ID(8字节)Type0x03:消息内容(可变长度)在加密层面,企业结构的设计体现了企业信ipad协议对移动网络环境的深度优化:紧凑的头部减少每包开销,TLV编码压缩业务字段,流加密保证前向安全。 理解这一结构,开发者可在合规前提下构建高效的协议代理层,将企业信协议接口的执行效率提升一个量级。

    10010编辑于 2026-03-10
  • 来自专栏音视频技术修炼手册

    Per-Title编码技术:自适应码率-画质-分辨率

    Per-Title编码技术Per-Title编码技术的目标,就是为每一个视频或视频片段量身定制,找到最优的凸包,精准锁定既满足画面清晰度要求,又符合主观观看敏感度标准的最低码率点,以达到节省带宽的目的 为了达到最佳质量的视频流,设计了两套不同的Per-Title优化算法:一是常规码率-分辨率选择的Per-Title优化算法;二是基于CRF(恒定质量因子)的Per-Title优化算法。 常规码率-分辨率选择的Per-Title优化算法与其他常规策略相比,的Per-Title优化算法在相同码率下能实现更高的视频质量,可以在最大码率限制下选择主观质量最优的分辨率,并且能够检测R-Q(码率 无论是追求极致的视频体验,还是严格控制传输成本,Per-Title优化算法都能给出最优的分辨率与CRF组合。相比固定CRF ,Per-Title有什么优势? 当然,除了Per-Title技术,也优化了多项前沿视频编码技术,如ROI(感兴趣区域)保护算法、智能AI前处理、基于内容的CAE感知编码等等......在视频编码技术的不断探索与研究优化,体现了对极致画质及高效传输的不懈追求

    47510编辑于 2024-10-24
  • 来自专栏OpenMMLab

    MMFlow :之间的追光者

    目前,MMFlow 代码库已于11月16日全面开源! GitHub 链接: https://github.com/open-mmlab/mmflow 等不及了吗!

    1.7K10编辑于 2022-01-18
领券