音频属性采样率、通道数、位数、比特率、帧等

声音定位⾳频属性采样率、通道数、位数、⽐特率、帧等
【⾳频】
指⼈⽿可以听到的声⾳频率在20HZ~20kHz之间的声波,称为⾳频。
【采样频率】
来源:⾳频采样,是把声⾳从模拟信号转换为数字信号。
定义:采样率,就是每秒对声⾳进⾏采集的次数,同样也是所得的数字信号的每秒样本数。
常⽤的采样率有:
8,000 Hz - 电话所⽤采样率, 对于⼈的说话已经⾜够
11,025 Hz - AM调幅⼴播所⽤采样率
22,050 Hz和24,000 Hz - FM调频⼴播所⽤采样率
32,000 Hz - miniDV 数码视频 camcorder、DAT (LP mode)所⽤采样率
44,100 Hz - ⾳频 CD, 也常⽤于 MPEG-1 ⾳频(VCD, SVCD, MP3)所⽤采样率
47,250 Hz - 商⽤ PCM 录⾳机所⽤采样率
48,000 Hz - miniDV、数字电视、DVD、DAT、电影和专业⾳频所⽤的数字声⾳所⽤采样率
50,000 Hz - 商⽤数字录⾳机所⽤采样率
96,000 或者 192,000 Hz - DVD-Audio、⼀些 LPCM DVD ⾳轨、BD-ROM(蓝光盘)⾳轨、和 HD-DVD (⾼清晰度 DVD)⾳轨所⽤所⽤采样率
2.8224 MHz - Direct Stream Digital 的 1 位 sigma-delta modulation 过程所⽤采样率。
采样频率⼤⼩意义:采样越⾼,声⾳的还原就越真实越⾃然,但同时它占的资源⽐较多。
⼈对频率的识别范围:是 20HZ - 20000HZ, 如果每秒钟能对声⾳做 20000 个采样, 回放时就⾜可以满⾜⼈⽿的需求. 所以 22050 的采样频率是常⽤的, 44100已是CD⾳质, 超过48000的采样对⼈⽿已经没有意义。这和电影的每秒 24 帧图⽚的道理差不多。
如果是双声道(stereo), 采样就是双份的, ⽂件也差不多要⼤⼀倍.
【声道】
当⼈听到声⾳时,能对声源进⾏定位,那么通过在不同的位置设置声源,就可以造就出更好的听觉感受,如果配合影像进⾏⾳频位置的调整,则会得到更好的视听效果。常见的声道有:
1. 单声道,mono
2. 双声道,stereo,最常见的类型,包含左声道以及右声道
3. 2.1声道,在双声道基础上加⼊⼀个低⾳声道
4. 5.1声道,包含⼀个正⾯声道、左前⽅声道、右前⽅声道、左环绕声道、右环绕声道、⼀个低⾳声道,最早应⽤于早期的电影院
5. 7.1声道,在5.1声道的基础上,把左右的环绕声道拆分为左右环绕声道以及左右后置声道,主要应⽤于BD以及现代的电影院
【采样位数】
⾳频在经过采样得到样本后,还需要对该样本执⾏两个步骤:
1.量化。⾳频量化的量化位数常⽤的有:
  8bit (也就是1字节) 只能记录 256 个数, 也就是只能将振幅划分成 256 个等级;
  16bit (也就是2字节) 可以细到 65536 个数, 这已是 CD 标准了;
  32bit (也就是4字节) 能把振幅细分到 4294967296 个等级, 实在是没必要了.
量化位数⼜叫做采样位数、位深度、分辨率, 它是指声⾳的连续强度被数字表⽰后可以分为多少级。也可以说是声卡的分辨率,它的数值越⼤,分辨率也就越⾼,所发出声⾳的能⼒越强。
2.⼆进制编码。也就是把量化所得的结果,即单个声道的样本,以⼆进制的码字进⾏存放。
【帧】
⾳频在量化得到⼆进制的码字后,需要进⾏变换,⽽变换是以块为单位(block)进⾏的,⼀个块由多个(120或128)样本组成。⽽⼀帧内会包含⼀个或者多个块。帧的常见⼤⼩有960、1024、2048、4096等。⼀帧记录了⼀个声⾳单元,它的长度是样本长度和声道数的乘积。
帧(frame)是⾳频⽂件的最⼩的组成单位
⼀个⾳频⾳频帧的播放时长计算为:
⾳频帧的播放时间=每帧对应的采样样本的个数/采样频率(单位为s)
如果我们定义⼀个mp3的采样率为44.1khz,假设mp3格式的每帧采样点为1152个,则⼀个mp3⾳频帧的长度为,1152 /44100
*1000 =26.122ms。
不同的⾳频⽂件,⾳频的帧采样点是不⼀样的
【⽐特率】
每秒的传输速率(位速, 也叫⽐特率)。如705.6kbps 或 705600bps, 其中的 b 是 bit, ps 是每秒(per second)的意思,表⽰每秒
705600bit的容量。压缩的⾳频⽂件常常⽤倍速来表⽰,譬如达到CD⾳质的MP3是128kbps/44100HZ。注意这⾥的单位是bit⽽不是Byte,⼀个Byte等于8个bit(位),bit是最⼩的单位,⼀般⽤于⽹络速度的描述和各种通信速度,Byte则⽤于计算硬盘,内存的⼤⼩。
【采样率、采样位数、⽐特率三者之间的关系】
⽐特率=采样率采样位数通道数
例:根据⼀个⽂件的⼤⼩推算出⽂件时长
譬如 “Windows XP 启动.wav” 的⽂件长度是 424,644 字节, 它是 “22050HZ / 16bit / ⽴体声” 格式(这可以从其 “属性->摘要”⾥看到),
那么它的每秒的传输速率(位速, 也叫⽐特率、取样率)是 22050162 = 705600(bit/s), 换算成字节单位就是 705600/8 = 88200(字节/秒),
播放时间:424644(总字节数) / 88200(每秒字节数) ≈ 4.8145578(秒)。
但是这还不够精确, 包装标准的 PCM 格式的 WAVE ⽂件(.wav)中⾄少带有 42 个字节的头信息, 在计算播放时间时应该将其去掉,
所以就有:(424644-42) / (2205016*2/8) ≈ 4.8140816(秒). 这样就⽐较精确了。也就是:
(⽂件总⼤⼩ - 头信息)/ (采样率 * 采样位数 * 通道数 / 8) [也就是⽐特率] ≈ ⽂件时长。
【参考】

本文发布于:2024-09-22 23:19:45,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/1/350781.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:采样   声道   采样率   位数   样本   量化   频率   特率
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议