H.266VVC新一代通用视频编码国际标准

第41卷第2期2021年4月
南京邮电大学学报(自然科学版)
JournalofNanjingUniversityofPostsandTelecommunications(NaturalScienceEdition)
Vol.41No.2Apr 2021
doi:10.14132/j.cnki.1673⁃5439.2021.02.001
H.266/VVC:新一代通用视频编码国际标准
朱秀昌,唐贵进
(南京邮电大学江苏省图像处理与图像通信重点实验室,江苏南京㊀210003)
摘要:在2013年制定的H.265/HEVC视频编码标准获得成功后,新一代视频编码国际标准H.266/
VVC在ITU⁃T的VCEG和ISO/IEC的MPEG通力合作下已于2020年7月完成㊂尽管VVC视频编码层的结构仍然是传统的基于块的混合视频编码模式,但VVC提供了多项先进的视频编码工具,
较先前的HEVC标准,其压缩率大约提高了一倍㊂文中主要对VVC标准中新编码技术的特点和性能进行综述㊂
关键词:H.266/VVC;HEVC;视频编码标准;联合视频专家组;视频压缩
中图分类号:TN919.8㊀㊀文献标志码:A㊀㊀文章编号:1673⁃5439(2021)02⁃0001⁃11
H.266/VVC:versatilevideocodinginternationalstandard
ZHUXiuchang,TANGGuijin
JiangsuProvinceKeyLabonImageProcessing&ImageCommunication,
NanjingUniversityofPostsandTelecommunications,Nanjing210003,China
(
)
Abstract:AftertheprofoundsuccessofdefiningH.265/HEVCvideocodingstandardin2013,thenewgenerationvideocodinginternationalstandardH.266/VVCwascollaborativelyfinalizedinJuly2020byboththeITU⁃TVCEGandISO/IECMPEGorganizations.AlthoughthestructureofVVCvideocodinglayerisconventionalblock⁃basedhybridvideocodingframework,VVCstilloffersseveraladvancedvideocodingtoolscomparedwithpreviousstandards.Thus,thecom
pressionrateofVVCisaboutdoublethatofHEVC.Finally,thetechnicalfeaturesandcharacteristicsoftheVVCstandardaresummarized.Keywords:H.266/VVC;HEVC;videocodingstandards;JVET;videocompression收稿日期:2021⁃03⁃04㊀㊀本刊网址:http:ʊnyzr.njupt.edu.cn作者简介:朱秀昌,男,教授,博士生导师,zhuxc@njupt.edu.cn
引用本文:朱秀昌,唐贵进.H.266/VVC:新一代通用视频编码国际标准[J].南京邮电大学学报(自然科学版),2021,41(2):1-11.
㊀㊀视频信息压缩技术在过去30余年以来的一系列视频编码国际标准中得到充分的体现㊂从20世纪90年代初的第一代视频编码标准H.261/MPEG⁃
1[1]㊁H.262/MPEG⁃2起,到第二代视频编码标准H 264/AVC[2],第三代视频编码标准H.265/
HEVC[3-4],每进化一代视频压缩的效率都大致提高一倍㊂HEVC第一版2013年发布7年后的今天,经两大国际标准化组织ITU⁃T和ISO/IEC的有关部门通力合作,又完成了第四代视频编码标准,简称通用视频编码(VersatileVideoCoding,VVC)标
准,已于
2020年7月发布第一版,其正式名称在ITU⁃T为H 266,在ISO/IEC为VVC(23090⁃3)[5]㊂VVC比
HEVC可以提高大约一倍的编码效率,也就是说编码相同可视质量的视频内容,大约只需要HEVC的
50%的比特,AVC的25%的比特㊂VVC的出现能够减轻世界网络的负担,因为目前视频流量已经占到互联网流量的80%左右,还有上升的趋势㊂此外,将 通用 (Versatility)这个词用作这个标准的标题,说明VVC的目标是支持多种类型的网络视频应用,如超高清视频㊁高动态范围视频㊁VR(VirtualReality)视频㊁360ʎ全景视频及屏幕内容等[6]㊂
VVC中的编码算法没有根本性的改进措施,它的技术手段和前面几代视频编码标准基本类似,仍然是在基于块的混合编码框架内,但几乎对编码的
每个环节都进行了改进,挤压尚未除尽的信息冗余,达到总体编码效率提高一倍的要求㊂
从ITU⁃T和ISO/IET联合制定视频标准H 262/MPEG⁃2于1994年推出开始,历
经H.264/AVC㊁H.265/HEVC,到如今的H.266/VVC,VCEG和MPEG的一个矢志不渝的目标为 减半 ,即每推出新一代标准都要求码率减半㊂以此算来,压缩同样的视频内容,在同样的解码视频质量的要求下,VVC的码率只有MPEG⁃2的1/8㊂
2015年10月,ITU⁃T的VCEG和ISO/IEC的MPEG成立了联合视频探索小组(JointVideoExplorationTeam,JVET),面向全球征集提案㊂2018年,新一代视频编码标准化工作正式开始,在同年JVET的第10次会议上,联合视频探索小组正式更名为联合视频专家组(JointVideoExpertsTeam,JVET),简称仍然是JVET,并决定将下一代视频编码标准正式命名为VVC,在ITU⁃T登记为H.266,在ISO/IEC登记为23090⁃3[6]㊂VVC标准对应的参考软件平台为VTM(VVCTestModel)[7],目前最新版本是VTM11.2㊂
钢管在线制定VVC有两个基本目标,其一为高压缩性能,定义一套视频编码技术,其压缩性能要远优于以往的同类标准;其二为宽应用领域,能够有效地用于比先前标准更广阔的范围㊂VVC标准面向多种应用,如高清㊁超高清视频(UltraHighDefinitionVideo,UHDV),它们具有3840ˑ2160或7620ˑ4320图像分辨率,10比特精度,高动态范围(HighDynamicRange,HDR)和宽彩gamut;再如沉浸式媒体(ImmersiveMedia),使用普通投影格式所投影的360ʎ全景视频(OmnidirectionalVi
deo)等㊂当然,VVC同样支持先前标准中所设置的那些应用㊂本文后续部分将主要介绍VCC所提供的新编码工具㊂从第1节到第6节共6个部分基本按照编码过程来介绍,包括图像分块㊁预测㊁变换㊁量化㊁熵编码和环路滤波等环节㊂最后是对VVC现有成果的小结,对其后续工作和应用前景的简单说明㊂1㊀图像划分
如图1所示,VVC在编码原理和基本结构方面没有突破,仍沿用从H.261就开始的基于块的混合视频编码框架,即预测加变换的分块编码方式;VVC在编码细节上和HEVC很接近,也包含帧内预测㊁帧间预测㊁运动估计与补偿㊁正交变换㊁量化㊁熵编码和环路滤波等模块㊂但是,和HEVC相比较,VVC几乎在每一个编码环节上都采取了一项或多项改进措施,尽管每一项措施的效率提高并不显著,然而诸多措施的总体效果确使其编码效率比HEVC提高了一倍㊂当然,VVC付出的代价就是编码复杂度也比HEVC提高了好几倍
图1㊀H.266/VVC编码框图
1.1㊀3种编码结构
VVC与HEVC一样,为了应对不同应用场合,设立了3种编码结构,即全帧内(AllIntra,AI)编码㊁低延迟(LowDelay,LD)编码和随机接入(RandomAccess,RA)编码㊂在AI编码中,每一帧图像都是按帧内方式进行空间域预测编码,不使用时间参考帧㊂在LD编码中,只有第一帧图像按照帧内方式进行编码,并成为即时解码更新(InstantaneousDecodingRefresh,IDR)帧,随后的各帧都作为普通P和B帧(GeneralizedPandBPicture,GPB)进行编码,这主要是为交互式实时通信设计的㊂在RA编码中,主要是分层B帧结构(HierarchicalBStructure)帧,周期性地插入一廋随机访问(CleanRandomAccess,CRA)帧,成为编码视频流中的随机访问点(RandomAccessPoint,RAP)㊂这些随机访问点可以独立解码,不需要参考码流中前面已经解码的图像帧㊂
1.2㊀图像的条/片/子图像划分
VVC在编码时将每一帧图像都划分为相同尺寸㊁紧密排列的编码树单元(CodingTreeUnit,CTU),根据编码图像局部特征的不同,编码树单元又可以灵活地划分为更小的编码单元(CodingUnit,CU)㊂
和HEVC基本相同,VVC允许将图像帧划分为若干条(Slice),条由相邻的整数个CTU组成㊂VVC支持两种排列类型的Slice,顺序扫描Slice模式和矩
硅胶表面电晕处理
2南京邮电大学学报(自然科学版)㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀2021年
形Slice模式㊂VVC中也允许用水平和垂直的若干条边界将图像帧划分为多个矩形区域,每个区域就是一个片(Tile),每一个片包含整数个CTU㊂VVC的Slice和Tile大体上和HEVC一致㊂
和HEVC不同,VVC还新增了矩形的子图像
(Subpicture)划分[5]㊂一个子图像可包含一个或多个Slices,这些Slices共同覆盖图像的一个矩形区域㊂相应地,每个子图像的边界总是Slice的边界㊂图2是包含Suppicture的划分一例,一帧图像被划分为18个Tiles,其中12个较大的Tiles在左边,每个Tile覆盖一个4ˑ4CTU的Slice;其余的6个较小的Tiles在右边,
每个覆盖2个2ˑ2CTU的Slices,这样总共形成24个Slices和24个子图像(每个Slice就是一个子图像
)㊂
图2㊀包含subpicture的划分一例
1.3㊀CTU的多类型树划分
养蜂专用车
在VVC中为了适应4K㊁8K等高清㊁超高清视频编码的需要,将CTU的最大尺寸扩大到128ˑ128,最小尺寸还是4ˑ4㊂CTU可进一步分为若干编码单元(CU),最大的CU可等同于CTU,最小的CU为4ˑ4㊂在HEVC中每个CU又可以划分为预测单元(PredictionUnit,PU)和变换单元(TransformUnit,TU),但在VVC中将不再区分CU㊁PU和TU,大多数情况下三者统一为CU㊂麦饭石杯
不同于HEVC,VVC的CTU除了4叉树划分方式外,还引进了多类型树(Multi⁃TypeTree,MTT)划分,包括2叉树(BinaryTree,BT)和3叉树(TernaryTree,TT)[8]㊂一个CTU首先按4叉树方式进行一次划分,4叉树的每个叶子节点既可以继续4叉树划分,也可以进一步按照多类型树方式进行划分:水平或垂直2叉树划分,水平或垂直3叉树划分,如图
3所示㊂2叉树和3叉树划分可以交替并嵌套进行㊂但是需要注意,一旦采用了2叉树或者3叉树划分,就不再允许进行4叉树划分㊂
图4中给出了一个64ˑ64的CTU的4叉树和嵌套多类型树划分的示例,这种划分方式可以根据图像内容自适应进行,提升了划分灵活性
图3㊀
多类型树划分模式
图4㊀4叉树和嵌套多类型树划分示例
前面介绍的是亮度CTU的MTT划分,对于图像的度部分,考虑到同一位置的亮度和度信号可能具有的不同特性,因而在VVC中,I帧CTU的亮度分量和度分量的划分方式可以不同,这时亮
度和度分量各使用一个编码树表示㊂对于P帧和B帧,则同一个CTU中的亮度和度必须有相同的划分㊂由于度信号的亚取样影响,度信号在单独划分时禁止出现2ˑ2㊁2ˑ4或4ˑ2尺寸的度块㊂
至此可以看到,图像划分从单一㊁固定划分不断朝着多样㊁灵活的划分结构发展㊂
1.4㊀图像格式
对于输入视频和重建视频,VVC支持
ITU⁃RBT.601建议规定的4ʒ4ʒ4㊁4ʒ2ʒ2和4ʒ
2ʒ0图像亮度(Y)和度(Cb和Cr)信号的取样结构;支持的ITU⁃RBT.2100的宽彩空间;最少支持
16级高动态范围(HDR)视频,最高亮度可达1000/4000/10000尼特㊂
像素的最大比特数表示图像灰度分辨率,又称为比特深度(BitDepth),其值通常为8比特,256个等级㊂这对于人眼的观赏已经足够了,但是对于编码处理或某些特殊应用场合,有时需要更高的比特深度㊂为此,VVC支持8至16比特深度的输入和输出视频,最常见是10比特深度㊂
VVC支持视频的0 120Hz可变帧率,以适应
不同视频应用的需求㊂支持环绕立体视频或多角度视频编码,如360ʎ㊁180ʎ等全景视频㊂
五轴深孔钻
第2期朱秀昌,等:H.266/VVC:新一代通用视频编码国际标准
至于尚存的隔行扫描(InterlacedScanning)视频,VVC和HEVC一样,不再提供专门的工具,只是将隔行视频的一帧看作两个独立的场,对各个场数据分别进行编码,简化了编码器的实现㊂
1.5㊀档次㊁水平和等级
为了提供应用的灵活性,和HEVC一样,VVC在附录A中定义了编码的不同的档次(Profile)㊁水平(Level)和等级(Tier)[5]㊂
档次 规定了视频编码采用什么编码工具和编码算法㊂VVC档次规定了一套用于产生不同用途码流的编码工具或算法,共有4个主档次,即常规10比特像素深度的Main10,支持静止图像的Main10StillPicture,支持全取样的Main104ʒ4ʒ4,支持全取样静止图像的Main104ʒ4ʒ4StillPicture㊂2个多层主档次,MultilayerMain10和MultilayerMain104ʒ4ʒ4㊂档次的主要技术指标包括:像素的比特深度㊁度采样方式和解码缓存的图像容量等㊂
水平 规定了某一档次㊁等级的编码参数,如采样率㊁码率㊁压缩率㊁缓冲区容量等㊂VVC设置了1.0,2.0,2.1,3.0,3.1,4.0,4.1,5.0,5.1,5.2,6.0,6.1,6.2共13个水平,一个水平实际上就是一套对编码比特流的一系列编码参数的限制,如视频采样格式㊁图像分辨率(如从176ˑ144到8192ˑ4320)㊁最大输出码率等㊂如果说一个解码器具备解某一水平码流的能力,则意味着该解码器具有解码等于和低于这一水平所有码流的能力㊂
等级 规定了每一水平的比特率的高低㊂对同一水平,按照最大码率和缓存容量要求的不同,VVC设置了两个等级,高等级(HighTier)和主等级(MainTier)㊂主等级可用于大多数场合,要求码率较低;高等级可用于有特殊要求的场合,包括5.0到6.2的6个水平,允许码率较高㊂
2㊀帧内预测
2.1㊀亮度分量的预测模式
VVC的帧内预测技术[9]的原理和HEVC类似,采用基于块的多方向帧内预测方式来消除图像的空间相关性,但是比HEVC预测方向更细㊁更灵活㊂如图5所示,VVC为亮度预测块定义了65种不同的基本帧内预测方向,相当于在HEVC帧内预测33个方向的每两个方向中间增加一个方向,连同平面(Planar)和直流(DC)模式,共67种预测模式㊂VVC亮度帧内预测单元的尺寸从4ˑ4到64ˑ64,其中包含矩形单元㊂考虑到方便矩形帧内预测块的宽角度(Wide⁃Angle)模式,VVC的帧内预测在65种方向的基础上分别增加了-1到-14和67到80方向,共28个方向,这样VVC帧内预测编码总共有93个方向
图5㊀帧内预测方向
DC模式的编码块所有像素的预测值都等于其左侧和上方已编码的所有参考像素的平均值㊂Planar模式的预测值由待编码的亮度块的水平和垂直两个方向上的参考像素的线性内插产生,它们一般适用于图像的平坦区域㊂
2.2㊀帧内子块划分
VVC的帧内子块划分(IntraSub⁃Partitions,ISP)就是根据编码块的尺寸将亮度预测块在水平或垂直方向上分为2个或4个子块㊂VVC规定每个帧内预测块至少要有16个样点,因此4ˑ4块不再划分㊂允许ISP划分的最小块尺寸是4ˑ8或8ˑ4,可划分为2个子块,如图6(a)所示;如果大于4ˑ8或8ˑ4则划分为4个子块,如图6(b)所示
图6㊀帧内子块划分
2.3㊀度的跨分量线性模式
HEVC度块采用依附亮度块的简化预测,共有5种模式,即Planar㊁DC㊁水平方向㊁垂直方向和派生模式(DerivedMode,DM),DM直接复制对应亮度块的预测模式㊂VVC度分量除了沿用这5种预
4南京邮电大学学报(自然科学版)㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀2021年
测模式外,还考虑到亮度和度之间的相关性,对度分量增加了一种跨分量线性模型(Cross⁃
ComponentLinearModel,CCLM)预测模式㊂在CCLM中,度样值C(i,j)从同一个编码单元对应的已重建的亮度样值Lᶄ(i,j)通过线性模型预测得到,即C(i,j)=α㊃Lᶄ(i,j)+β,α和β为CCLM参数,可利用当前块左侧和上方相邻的像素通过计算得到㊂此外,还有单独使用左侧相邻像素预测的LM_L模式;或者上方相邻像素预测的LM_A模式㊂这样,度分量在5种传统帧内预测模式的基础上,新增了CCLM㊁LM_A和LM_L三种模式,共有8种预测模式㊂
2.4㊀多行参考帧内预测
传统的帧内预测利用和当前块紧相邻的行和列的像素作为参考像素㊂如果当前块和参考行在内容上不连续,可能会导致较大的预测误差,为此VVC新增了多行参考(MultipleReferenceLine,MRL)帧内预测技术,将参考行从相邻参考行0扩展为参考行0㊁参考行1和参考行3[9-10]㊂实际预测时从3行中选择预测误差最小的参考行作为最终预测使用的最佳参考行,如图7所示㊂图7中A和F区域的已重建像素与当前块距离较远,有可能引入较大的误差,因此A区域的像素由B区域距离最近的像素填
充,F区域的像素由E区域距离最近的像素填充
图7㊀多行参考方式
2.5㊀帧内预测模式的编码
帧内预测时,编码器需要从多种预测模式中选
择一种最佳模式使得编码效率最优㊂如果直接对预
测模式信息进行编码,需要较多的编码比特㊂考虑
铝塑型材
到相邻块之间的帧内预测模式也存在空间相关性,
即当前块的预测模式很有可能与相邻块的预模式一
致,因此可以从相邻块的模式来预测当前块最可能
的模式(MostProbableMode,MPM)[11]㊂当前块的预测模式被划分为MPM和其余模式,然后对这两
类模式分别编码,以提升编码效率㊂3㊀变换和量化
视频压缩中的变换是将空间域的图像信号转换
到频率域,大幅度解除了图像信号之间的相关性,为
后续的量化压缩创造条件㊂因此,选择何种变换函
数和采用什么量化方法就显得分外重要[12-13]㊂在HEVC中,对帧内预测生成的4ˑ4亮度残差
块采用离散正弦变换(DiscreteSineTransform,DST)
方式,对于其他的残差块,则使用离散余弦变换(DiscreteCosineTransform,DCT)方式㊂通过残差4叉树(ResidualQuadTree,RQT)对变换块系数进行排序和量化㊂
与HEVC不同,VVC为了提高压缩性能,在变
换环节提供了更多可供选择的变换函数和不可分离
的二次变换,在量化环节采用了基于率失真优化的
量化方式和简洁的系数排序方式㊂
3.1㊀多变换选择
VVC将最大变块换尺寸扩展到64ˑ64,在HEVC的DCT⁃2变换基础上,采用了多变换选择(MultipleTransformSelection,MTS)技术,增加了DST⁃7和DCT⁃8两种变换函数,形成一组候选变换函数集,成为VVC中的主变换(PrimaryTransform)㊂对于长或宽等于64的大尺寸变换块,直接舍弃高频变换系数,仅保留低频变换系数㊂例如,对于长宽为MˑN的块,若M等于64,只保留左边32列系数,若N等于64,只保留上方32行系数㊂
针对帧间预测的CU,VVC还采用了子块变换(Sub⁃BlockTransform,SBT)技术㊂SBT假设帧间预测残差分布的局部性,仅分布在残差块的局部1/2或1/4区域,从而降低变换系数的高频分量,减少标记残差块是否为0的编码代价,提高压缩性能㊂对不同的预测方式,编码器可以根据哪一种变换的编码效率最高来选择不同的变换方式㊂3.2㊀二次变换
由于不可分离变换比可分离变换具有更好的去
相关效果,VVC采用了基于归零(Zero⁃Out)的不可
分离二次变换(Non⁃SeparableSecondaryTransform,NSST)技术㊂所谓二次变换,就是对主变换系数进行第二次变换,将信号从一个变换域转换至另外一个变换域后再进行量化㊁熵编码等操作,其目的是进一步提高变换效率㊂AVC和HEVC都提供了自己的二次变换技术㊂VVC采用了NSST技术对高频系数采用归零方案,也就是仅保留二次变换的低频系数,高频系数假设为0,NSST也因此被称作低频不
第2期朱秀昌,等:H.266/VVC:新一代通用视频编码国际标准

本文发布于:2024-09-22 14:39:58,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/3/219086.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:编码   视频   预测
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议