常见的视频编码技术和标准123

基础知识讲座

2006 NO.9&10 记录媒体技术

随

着我国具有自主知识产权的视频编码国家标准AVS 的发布，视频编码技术和标准引起了行业

内人士的极大兴趣和关注。

光盘行业比较熟悉的视频编码国际标准是MPEG 系列编码标准，这是因为MPEG-1标准成功地推动了VCD 产业，而MPEG-2标准带动了DVD 及数字电视等多种消费电子产业的快速发展。随着视频编码技术的广泛应用和迅速发展，更多的视频编码技术和标准展现在我们面前。目前，最为重要的视频编码国际标准包括国际标准化组织(ISO)和国际电工委员会(IEC)关于静止图像的编码标准JPEG ，国际电信联盟(ITU-T)关于可视电话和电视会议的视频编码标准H.261、H.263、H.264，以及国际标准化组织的运动图像专家组的系列标准MPEG-1、MPEG-2、MPEG-4。此外，在互联网上被广泛应用的还有Real-Networks 公司的RealVideo 、微软公司的WMV 、Apple 公司的QuickTime 等格式。这些视频编码技术融合了各种性能优良的图像编码算法，代表了目前图像编码的发展水平。下面就光盘相关的视频编码技

术和标准进行简要的评述。

一、H.261、H.263、H.264系列标准

ITU-T 与ISO/IEC 是制定视频编码标准的两大国际组织，其中ITU-T 制定的标准包括H.261、H.263、H.264，主要应用于实时视频通信领域，如视频会议；MPEG 系列标准是由ISO/IEC 制定的，主要应用于视频存储、广播电视、因特网或无线网络的流媒体等。两个组织也共同制定了一些标准，H.262标准等同于MPEG-2的视频编码标准，而最新的H.264标准则被纳入MPEG-4的第10部分。1. H.261

H.261又称为P*64，其中P 为64kb/s 的取值范围，是1到30的可变参数，它最初是针对在ISDN 上实现电话会议(特别是面对面的可视电话和视频会议)而设计

常见的视频编码技术和标准(I)

◇祖晟

的。H.261的实际编码算法类似于MPEG 算法，但不能与后者兼容。H.261在实时编码时比MPEG 所占用的CPU 运算量少得多，为了优化带宽占用量，引进了在图像质量与运动幅度之间的平衡机制。也就是说，在H.261编码中，剧烈运动的图像比相对静止的图像质量要差。因此，该编码方法属于恒定码流可变质量编码，而不是恒定质量可变码流编码。2. H.263

H.263是国际电联ITU-T 的一个标准草案，是为低码流通信而设计的。但实际上这个标准可用于很宽的码流范围，而不是仅限于低码流应用。H.263在许多应用中可以用来取代H.261。H.263的编码算法与H.261一样，但做了一些改善以提高性能和纠错能力。H.263标准在低码率下能够提供比H.261更好的图像效果，两者的区别主要包括以下几点：(1)H.263的运动补偿使用半像素精度，而H.261则用全像素精度和循环滤波；(2)数据流层次结构的某些部分在H.263中是可选的，这使得编解码可以配置成更低的数据率或更好的纠错能力；(3)H.263包含四个可协商的选项以改善性能；(4)H.263采用无限制的运动向量以及基于语法的算术编码；(5)采用事先预测和MPEG 中的P-B 帧预测方法；(6)H.263支持5种分辨率，除了支持H.261所支持的QCIF 和CIF 外，还支持SQCIF 、4CIF 和16CIF ，SQCIF 相当于QCIF 一半的分辨率，而4CIF 和16CIF 分别为CIF 的4倍和16倍。

1998年IUT-T 推出的H.263+是H.263草案的第2版，它提供了12个新的可协商模式和其它特性，进一步提高了压缩编码的性能。例如，H.263只有5种视频源格式，而H.263+允许使用更多的源格式，图像时钟频率也有多种选择，从而拓宽了应用范围。另一重要的改进是可扩展性，H.263+允许多显示率、多速率以及多分辨率，增强了视频信息在易产生误码、易丢包异构网络环境下的传输。另外，H.263+对H.263的不受限运动矢量模式进行了改进，加上12个新增可选模式，不

光工作站79金钢砂轮>pcu h

基础知识讲座

2006 NO.9&10 记录媒体技术

仅提高了编码性能，而且增强了应用的灵活性。3. H.264

2001年，MPEG 同ITU 的视频编码专家组VCEG 再次组成联合视频编码专家组JVT ，对H.26l 的算法进行了改进和完善。2003年5月，VCEG 发布了H.264的压缩标准。MPEG 在JVT 对H.26l 压缩算法修改的基础上，将该技术规范纳入到MPEG-4的标准中，作为MPEG-4 part10发布，即MPEG-4的第三版，MPEG-4 A VC 。

为了降低码率和获得更好的图像质量，H.264标准吸取了MPEG-4的长处，具有更高的压缩比和更好的信道适应性，而最具价值的部分无疑是更高的数据压缩比。在同等的图像质量条件下，H.264的数据压缩比能比当前DVD 系统中使用的MPEG-2高2~3倍，比MPEG-4高1.5~2倍。正因为如此，经过H.264压缩的视频数据，在网络传输过程中所需要的带宽更少，同时也更加经济。当MPEG-4编码需要6Mbps 的传输速率匹配时，H.264只需要3Mbps-4Mbps 的传输速率。此外，H.264获得优越性能的代价是计算复杂度的大幅增加，例如分层设计、多模式运动估计、改进的帧内预测等，这些都显著提高了预测精度，从而获得比其它标准好得多的压缩性能。

由ITU-T 和ISO/IEC 的联合开发组共同开发的H.264被认为是最有影响力的行业标准。它保留了以往压缩技术的优点和精华，又具有其它压缩技术无法比拟的优点，例如：

(1)低码率：与MPEG-2和MPEG-4ASP 压缩技术相比，在同等的图像质量下，采用H.264技术压缩后的数据量只有MPEG-2的1/8、MPEG-4的1/3。显然，H.264压缩技术的采用将大大节省用户的下载时间和数据流量收费。

(2)高质量的图像：H.264能够提供连续、流畅的高质量图像(DVD 质量)。

(3)容错能力强：H.264提供了一些必要的工具，用以解决在不稳定的网络环境下发生的丢包等错误。

(4)网络适应性强：H.264提供了网络适应层，使得H.264的文件很容易在不同的网络上传输(例如互联网、CDMA 、GPRS 、WCDMA 、CDMA2000等)。

二、MPEG 系列标准

MPEG 是运动图像专家组(Moving Picture Exports Group)的缩写，于1988年成立，是为数字视/音频制定压缩标准的专家组。目前MPEG 已拥有300多名成

员，包括IBM 、SUN 、BBC 、NEC 、INTEL 、AT&T 等世界知名公司。MPEG 组织最初得到的授权是制定用于“运动图像”编码的各种标准，随后扩充为“及其伴随的音频”的组合编码。后来针对不同的应用需求，解除了“用于数字存储媒体”的限制，成为现在制定“运动图像和音频编码”标准的组织。MPEG 组织制定的各个标准都有不同的目标和应用，目前已提出MPEG-1、MPEG-2、MPEG-4、MPEG-7和

MPEG-21标准。

MPEG 是运动图像压缩算法的国际标准，现已被几乎所有的计算机平台共同支持。和前面某些视频格式不同的是，MPEG 采用有损压缩方法减少运动图像中的冗余信息从而达到高压缩比的目的，当然这些是在保证图像质量的基础上进行的。MPEG 压缩标准是针对运动图像而设计的，其基本方法是：在单位时间内采集并保存第一帧信息，然后只存储其余帧相对第一帧发生变化的部分，从而达到压缩的目的。MPEG 的平均压缩比为50:1，最高可达200:1，压缩效率之高由此可见一斑。同时，MEPG 标准的图像和音响的质量也非常好，并且在微机上有统一的标准格式。MPEG 标准包括MPEG 视频、MPEG 音频和MPEG 系统(视频、音频同步)三个部分，MP3音频文件就是MPEG 音频的一个典型应用，而Video CD(VCD)、Super VCD(SVCD)和DVD(Digital Versatile Disc)则是全面采用MPEG 技术的消费类电子产品。

如果要了解MPEG 运动图像压缩算法的国际标准，首先要从1993年8月公布的MPEG-1标准开始。1．MPEG-1

1993年制定的MPEG-1标准是针对1.5Mbit/s 速率的数字存储媒体运动图像及其伴音编码制定的国际标准，该标准的制定使得基于CD-ROM 的数字视频以及MP3等产品成为可能。MPEG-1带宽最多为1.5Mbit/s ，其中1.1Mbit/s 用于视频，128Kbit/s 用于音频，其余带宽用于MPEG 系统本身。

MPEG-1标准包括五个部分：第一部分说明了如何根据第二部分(视频)以及第三部分(音频)的规定，对音频和视频进行复合编码。第四部分说明了检验解码器或编码器的输出比特流符合前三部分规定的过程。第五部分是一个用完整的C 语言实现的编码和解码器。

二次沉淀池为了追求高的压缩效率，去除图像序列的时间冗余度，同时满足多媒体等应用所必须的随机存取要求，MPEG-1视频把图像编码分成I 帧、P 帧、B 帧和

基础知识讲座

2006 NO.9&10 记录媒体技术

D 帧共4种类型。I 帧为帧内编码帧，编码时采用类似JPEG 的帧内DCT 编码，I 帧的压缩率是几种编码类型中最低的。P 帧为预测编码帧，采用前向运动补偿预测和误差的DCT 编码，由其前面的I 或P 帧进行预测。B 帧为双向预测编码帧，采用双向运动补偿预测和误差的DCT 编码，由前面和后面的I 或P 帧进行预测，所以B帧的压缩效率最高。D 帧为直流编码帧，只包含每个块的直流分量。MPEG-1采用运动补偿去除图像序列时间轴上的冗余度，可使对P 帧和B 帧图像的压缩倍数比I帧提高很多。

从颁布的那一刻起，MPEG-1就取得一系列的成功，如VCD 和MP3的大规模应用，Windows95之后的

版本都带有MPEG-1软件解码器，以及可携式MPEG-1摄像机的产生等。2．MPEG-2

MPEG 组织于1994年推出MPEG-2压缩标准，以实现视/音频服务与应用互操作的可能性。MPEG-2标准是针对标准数字电视和高清晰度电视在各种应用下的压缩方案和系统层的详细规定，编码码率为每秒3Mb~100Mb ，标准的正式规范收录在ISO/IEC13818中。需要说明的是，MPEG-2并不是MPEG-1的简单升级，MPEG-2在系统和传送方面作了更加详细的规定和进一步的完善。MPEG-2特别适用于广播级的数字电视的编码和传送，被认定为SDTV 和HDTV 的编码标准。

MPEG-2图像压缩的原理是利用了图像中的两种特性：空间相关性和时间相关性。这两种相关性使得图像中存在大量的冗余信息，如果我们能将这些冗余信息去除，只保留少量非相关信息进行传输，就可以大大节省传输频带。而接收机利用这些非相关信息，按照一定的解码算法，可以在保证一定的图像质量的前提下恢复原始图像。一个好的压缩编码方案就是能够最大限度地去除图像中的冗余信息。

MPEG-2的编码图像被分为三类，分别称为I 帧，P 帧和B 帧。

I 帧图像采用帧内编码方式，即只利用了单帧图像内的空间相关性，而没有利用时间相关性。P 帧和B 帧图像采用帧间编码方式，即同时利用了空间和时间上的相关性。P 帧图像只采用前向时间预测，可以提高压缩效率和图像质量。P 帧图像中可以包含帧内编码的部分，即P 帧中的每一个宏块可以是前向预测，也可以是帧内编码。B 帧图像采用双向时间预测，可以大大提高

压缩倍数。

MPEG-2编码的码流分为六个层次。为更好地表示编码数据，MPEG-2用句法规定了一个层次性结构。它分为六层，自上到下分别是：图像序列层、图像组、图像、宏块条、宏块、块。

MPEG-2标准在广播电视领域中的主要应用包括如下几个方面：

(1) 视音频资料的保存

以前，电视节目和音像资料等都是用磁带保存的。这种方式有很多弊端：易损坏、占地多、成本高、难于重新使用，更重要的是难以长期保存，难以查、难以共享。随着计算机技术和视频压缩技术的发展，高速宽带计算机网络以及大容量数据存储系统给电视台节目的网络化存储、查询、共享、交流提供了可能。

螺旋锥蝇采用MPEG-2压缩编码的DVD 视盘给资料保存带来了更多的选择。电视节目、音像资料等可通过MPEG-2编码系统编码，保存到低成本的CD-R 光盘或高容量的可擦写DVD-RAM 光盘上，也可利用DVD 编著软件(如Daikin Scenarist NT 、Spruce DVD-Maestro 等)制作成标准的DVD 视盘，既可以节约开支，也能够节省存放的空间。

(2) 电视节目的非线性编辑系统及其网络在非线性编辑系统中，节目素材是以数字压缩方式存储、制作

和播出的。视频压缩技术是非线性编辑系统的技术基础，主要有M-JPEG 和MPEG-2等数字压缩格式。M-JPEG 技术即运动静止图像(或逐帧)压缩技术，可进行精确到帧的编辑，但压缩效率不高。MPEG-2采用帧间压缩的方式，只需进行I帧的帧内压缩处理，B 帧和P 帧通过侦测获得，传输和运算的数据大多由帧之间的时间相关性得到。相对来说，MPEG-2的数据量小，可以实现较高的压缩比。随着逐帧编辑问题的解决，MPEG-2将广泛应用于非线性编辑系统，并大大地降低编辑成本，同时MPEG-2的解压缩是标准的，不同厂家设计的压缩器件压缩的数据可由其它厂家设计解压缩器来解压缩，这一点保证了各厂家的设备之间能完全兼容。

由于采用MPEG-2视频压缩技术，数据量成倍减少，降低了存储成本，提高了数据传输速度，减少了对计算机总线和网络带宽的压力，采用纯以太网组建非线性编辑网络系统已成为可能。目前以太网是最为成熟的网络，系统管理比较完善，价格也比较低廉。

[下转第50页]

技术论坛

2006 NO.9&10 记录媒体技术

(b)

图12移动小型光驱的振动测试结果，其中(a)为无阻尼条件下的实验结果，(b)为有阻尼条件下的实验结果

4．结论

本文回顾了小型光驱的发展历程，重点介绍了DataPlay 、飞利浦、三星、LG 等公司在小型光驱方面的研究进展，并详细介绍了一种新型的小型化光学头及力矩器设计。对装配该光学头的小型光驱进行测试，结果表明，采用限幅均衡器可以获得Jitter 值为

6.8%的良好读出信号。此外，利用水平放置磁路的新型力矩器，可以有效的降低光学头的高度，提高DC 和AC

灵敏度并同时减小功耗。◆

[上接第80页]

中含有存储容量为3.3GB 的46mm 直径只读光盘。该样机由弹出装载机构、小型主轴电机、滑动电机以及2mm 厚的支架型卡带组成。

图11 小型光驱的实物图

图12是在上述操作环境下的振动测试结果，其中振动的参数与硬盘驱动器的规格相同，正弦扫描频率从5Hz 到500Hz ，峰值为1.4g 。这些图片也揭示了有无阻尼所造成的差别。实线表示在光盘内圈半径处旋转光盘表面与物镜之间的相对距离，点划线表示在光盘外圈半径处的相对距离，而虚线表示伺服控制所要求的最小开环增益。因此，为了保证在工作环境下驱动器的平稳以及最小化由外界振动造成的干扰，实线和点划线应该在虚线的下面。实际上，该光盘系统的自然共振频率接近374Hz ，并且呈现伞状的模式。然而，通过在驱动器中插入阻尼胶，可以获得稳定的工作特性，如图12(b )所示。

微波真空烧结炉

(a)

图10 使用限幅均衡器的读出信号

(Jitter: 6.8%)

本文发布于:2024-09-23 01:28:45，感谢您对本站的认可！

本文链接：https://www.17tex.com/tex/2/236899.html

上一篇：10bit视频编码--特性及全面播放方法介绍

下一篇：视频压缩转码FFmpegFrameRecorder