音频制作与转换——音频编码的三步骤

⾳频制作与转换——⾳频编码的三步骤

在⾳频制作、转换、播放、传输中，我们常遇到许多专业术语。对于这些术语，⾮专业⼈⼠很难透彻的理解，其实也需要特别精通。本为⼒图以⾮专业的语⾔来描述那些常⽤的参数。其中包括：采样、采样频率、采样精度、综合采样率、量化、编码、码率、数据速率、⽐特率、位速率、位、字节数等。

绝对不是权威解释，只是个⼈理解。

许多⼈在制作、转换了⾳频⽂件后，常常疑惑为什么不能在⾃⼰的播放设备上播放，这是因为同样的⾳频⽂件，其编码格式及其参数设置千差万别，没有⼀个设备能全能播放不同格式和参数的⾳频⽂件。其中很⼤程度与本⽂介绍的内容有关。因此，就本⽂涉及到的内容，建议如下：

1、要按照你的播放设备能够⽀持的⾳频⽂件的相关参数进⾏设置。

2、当制作⾳频⽂件，或将CD光盘⾳乐⽂件转换为其它⾳频⽂件时，最好采⽤标准的⾳频参数（⽆损），以便今后可以根据需要转换为各种不同的格式。

3、在⾳频转换中，超出源⾳频⽂件的参数设置进⾏转换是没有实际价值的。也就是说，任何转换软件都⽆法将低质量的⾳频转换为⾼质量的⾳频。只能根据需要由⾼向低转换。巧妇难为⽆⽶之炊。同样的道理，⼀个单通道的⾳频⽂件，⽆需将其转换为双通道，因为其根本没有⽴体声效果，即便是⽤双通道播

放，两个通道的声⾳是⼀样的。反⽽会增⼤⾳频⽂件。

⾳频编码的三步骤

⾳频编码就是通过采样—量化—编码三个主要步骤，将声⾳变为数据⾳频⽂件。⾳频制作或转换，实际就是对声⾳信号进⾏编码。

⼀、采样

采样的过程就是采集声⾳信号某点的频率值和能量值。

采样点越多。采得的信息就越丰富，还原后就越接近源声⾳的质量。

采样的多少主要由采样频率、采样精度这两个参数表⽰。

（⼀）采样频率（Hz、kHz）

采样频率⼀般设置为44.1（44）kHz（标准的⾳频采样频率）就完全可以满⾜⾼质量⾳频收听的需要。

采样频率以Hz（赫兹）或kHz（千赫兹）为单位，表⽰每秒钟采样的次数。

著名的奈奎斯特定理（Nyquist Theorem）指出，如果要保存原始信号的所有信息，必须⽤不⼩于原始信号2倍的频率进⾏采样。也就是说，对声波每次振动，必须有2个点的采样。

⼈⽿所能听到的声⾳频率是20Hz到20 kHz之间，20 kHz以上的⾳频⼈⽿是听不到的。所以根据⼈⽿的频响特征，常选取其20 kHz频率

的2倍多⼀点的44.1kHz作为标准的采样频率。

22.050 kHz（22 kHz），可以达到CD⾳质的⼀半，只能达到FM⼴播的声⾳品质，⽬前被⼤多数⽹站选⽤。

44.1 kHz（44 kHz），标准的CD⾳质，可以达到很好的听觉效果。

48 kHz，可以更加精确⼀些。主要适⽤于对声⾳的录制采样。对抓轨（CD光盘⾳乐⽂件转换）或转换软件来说，保持44.1 kHz采样频率才是最佳⾳质的保证之⼀。mp3制作

（⼆）采样精度（bit）

采样精度⼀般设置为16位（标准的⾳频采样精度）就完全可以满⾜⾼质量⾳频收听的需要。

采样光有次数多少是不够的，还必须采得该频率点的能量值（信号强度），其⽤采样精度（位数）来表⽰。

采样精度以bit（⽐特、位）为单位。表⽰每秒钟采得能量值的精度。

例如：8位代表2的8次⽅，为256个精度单位，16为代表2的16次⽅，为64K个精度单位。

采样位数客观地反映了对输⼊声⾳信号描述的准确程度。位数越⼤，采集并记录的精度越⾼，信息量越⼤，越接近源声⾳的质量，即记录越准确，失真越⼩。

16位的采样精度对于电脑多媒体⾳频⽽⾔已经绰绰有余了。超⾼的采样位数没有什么实际意义。实际上⽬前流⾏的都是16位的，⼤部分也不提供超⾼位数的设置选项。有些号称可以达到32位，也不过是需要使⽤特定的软件对16位进⾏加速。

（三）综合采样率（bps、kbps）

综合采样率越⾼，采得的信息就越丰富，还原后就越接近源声⾳的质量。

综合采样率以bps（⽐特）、kbps（千⽐特）位单位，表⽰每秒钟采样的总⽐信息量。

综合采样率不仅包含采样频率、采样精度指标，还包含了声道指标。

综合采样率=采样频率╳采样精度╳通道数

例如：标准的⾳频采样率=16（bit）╳44.1（kHz）╳2（双通道）=1411.2（kbps）

综合采样率都是由采样精度、采样频率、声道数量决定的，⼀般情况下都⽆需设置综合采样率。⼤部分情况下，也不提供这个选项。

⼆、量化

量化的过程就是将声⾳模拟信号转换为⼗进位制数字信号的过程。

采样所得的信号仍然是不连贯（离散）的模拟信号。为了实现以数字码表⽰采样值，必须采⽤“四舍五⼊”的⽅法把采样值分级“取整“，使采样值由⽆限多个值变为有限个值。量化后的采样信号就转化为按采样时序排列的⼀串⼗进制数字码流，即⼗进制数字信号。

量化的过程是由编码器按照统⼀标准进⾏的，⼀般⽆需（也不提供选项）⼈⼯设置。

三、编码

把量化的采样信号由⼗进位制的数字信号转换为⼆进位制数字记录下来，并进⾏压缩的过程称为编码。

只有经过编码才是能够存储、传输、还原（解码）的⾳频数字信号。编码的过程⼜是有损或⽆损压缩的过程。在满⾜⼀定需要的收听质量的前提下，尽量压缩以减⼩⾳频⽂件和数据量，是⼈们追求的⽬标。因为⽂件和

数据量越⼤，对存储设备、传输设备、解码设备、播放设备等的要求越⾼。所以，各种不同的编码格式应运⽽⽣。

编码的结果，常⽤码率（数据速率、⽐特率、位速率）来表⽰。

码率（数据速率、⽐特率、位速率）（bps、kbps、Bps、kBps）

⽤编码（压缩）后的⽐特数（位数或字节数）表⽰⾳频⽂件制作每秒钟具有的数据量。同时还表⽰⾳频⽂件解码，播放、传输等需要或可处理的数据量。有时还⽤于计算⾳频⽂件的⼤⼩。

在相同的综合采样率的情况下，码率越⾼，⾳频质量越接近综合采样的质量。码率越⾼，⾳频⽂件越⼤。要求解码器、声卡、⽹络传输等具有更⾼的处理能⼒。

从这⼀点上讲，低质量的综合采样率，采⽤⾼码率转换并不能使⾳频质量超过采样质量。反⽽会⽆效地加⼤⾳频⽂件，加⼤⾳频⽂件⽆效内容。因此，根据综合采样数量确定合理的码率，是⼀个应该掌握的技术。

为了解决⾼码率⾯临的问题，在保持可接受质量损失的前提下，采⽤不同的压缩技术，降低码率，是⼈们追求的⽬标。因为只有降低码率，才能减少存储空间（例如：在光盘上录⼊更多⽂件），实现⽹络流畅传输和在线播放等。

码率⼀般有两种表⽰⽅法：

1、⽤位数表⽰。单位是（bps、kbps）。此中⽅法常⽤于⽹络速度，例如：512K，表⽰每秒钟可传输的位数。

例如：标准的⾳频采样率=16（bit）╳44.1（kHz）╳2（双通道）=1411.2（kbps），如果⽤位数表⽰，就是1411.2K了。

2、⽤字节数表⽰。单位是（Bps、kBps）。此是普遍采⽤的⽅法。当采⽤⼤写B时，这表⽰的是字节数，不过许多流⾏的表⽰⽅法并不采⽤⼤写，这就需要根据其提供的数据来判断了。

字节数=综合采样率／8（因为8个位=1个字节，即1Bps=8bps）

例如：标准的⾳频码率=16（bit）╳44.1（kHz）╳2（双通道）／8=1411.2（kbps，综合采样率）／8=176.4（kBps），

192K（码率）=16（bit）╳48（kHz）╳2（双通道）／8=1536（kbps，综合采样率）／8=192（kBps），

⽤位数表⽰的⽹络速度，除以8，就是字节数。例如：512K／8=64K。

从计算可知，码率设置等于或略⾼于综合采样率是⼀个合理的选择，超⾼没有实际价值。

许多⾳频制作、转换软件提供了多种码率选择，其并不是绝对与上述计算公式所得⼀样的，因为其采⽤的编码格式的压缩⽐、压缩⽅式不同。

⼀般情况下，码率达到256K已经⾜够了，⽬前最⾼的可达320K。MP3常⽤的码率为128K。

四、⾳频⽂件⼤⼩的计算

为什么要计算⾳频⽂件的⼤⼩。因为常要将⾳频⽂件刻录到容量有限的光盘中，有些⽹站限制上传⽂件的⼤⼩，有些播放设备存储能⼒有限等，这都需要在⾳频制作时，事先根据限制来计算制作的⾳频⽂件的⼤⼩，从⽽选择不同的码率。

⾳频⽂件的⼤⼩（字节数）=码率╳秒数。

例如：制作⼀个长度为5分钟（300秒），码率为128（kBps，字节）的⾳频，

其⽂件⼤⼩为：128（kBps）╳300（秒）=38400（kBps，字节）=38.4（MBps）。

⼀张容量为700MB的光盘，最多能存储18个同样⼤⼩的⾳频⽂件。

本文发布于:2024-09-21 05:47:19，感谢您对本站的认可！

本文链接：https://www.17tex.com/tex/4/350261.html

上一篇：MP3工作原理[图解]

下一篇：音频工程师如何进行音频编辑和剪辑

标签：采样转换频率码率精度质量采样率综合

留言与评论（共有 0 条评论）