一、 数字音频技术发展概况
1、 音频信号来源:携带声音息信的机械波;通过机器对现实声音的模拟、合成。 2、 声音的两个重要属性:音调和响度
响度:是声音强度,声压越大响度越高。
人耳对声音的频率听觉反应,其频率从20HZ 到20kHZ 的范围内。
语音主要由声带振动产生的,男子声带长而厚,发声频率低,基音约为150HZ,而女声基音约为230Hz。
人耳所判断声音的响度,同声压级和频率都有关系。
3、 对人耳的听觉特性:人耳所判断声音的响度,同声压级和频率都有关系。
4、 与音质抨价有关的几个听觉效应。
双耳效应:人耳头部两侧,约20cm,由于到达人的双耳的声音存在微小的时间差、强度差和相位差,人们能分辨声音的方向,确定声源的位置。(立体声系统是根据人的双耳效应发展而来的。
掩蔽效应:噪音对语言的妨害程度,在声学上称为“掩蔽效应”。(不仅取决于声压级而且取决于频率)
● 低音调的声音,会对高音调的声音产生较显著的掩蔽作用。
● 高音调的声音对低音调的声音只产生很小的掩蔽作用。
● 掩蔽声和被掩蔽声的频率越接近,掩蔽作用越大。
哈斯效应:是关于人耳对回声的感觉规律。
● 当直达声和反射声之间延迟时间超过100ms时,几乎所有的人都能觉察到回声。
● 当直达声和反射声之间延迟时间大于70ms时,差不多一半人觉察到回声。
● 当直达声和反射声之间延迟时间大于50ms时,人耳就能辨别出来自不同方向的两个独立的声音。
● 当直达声和反射声之间延迟时间小于30ms时,一般人耳不能区分出来。
● 当直达声的强度比反射声强度高10dB以上时,几乎没有人能感觉到回声。
5、 声音质量的评价
音质的客观评价
音质的主观评价:电声系统的音质评价、语音音质评价、乐音音质评价
二、 数字音频技术基础知识
1、与模拟化的信息相比较,数字化的音频信息具有那些优越性?
● 能实现高效编码,利于节省存储空间。
● 抗干扰能力强,便于进行中继传输。
● 可以进行差错控制,提高信息传输存储的可靠性。
● 便于使用计算机技术进行管理。
● 容易和其他系统配合使用,控制系统功能。
● 便于加密,容易实现信息的保密或版权保护。
● 易于集成化和大规模生产。
2、PCM是“数字化”中最基本的技术:它包含三个操作步骤:取样、量化和编码。3、数字音频存储技术的类别:
● 数字音频磁存储技术:数字磁带录音机、硬盘录音机
● 数字音频光盘存储技术:LD类、CD类、DVD类。
● 数字音频半导体存储技术:RAM和闪存
4、 数字音频网络传输技术:带宽要求和传播形式
带宽要求:
● 普通语音:频率带宽要求〈=3.4KHZ,8kHZ取样,8bit量化,数据率为64kb/s。
● 高质量语音:频率带宽要求是50HZ~7KHZ。经压缩后数据率为48~64kb/s
● CD-DA双声道立体声:频率带宽要求〈=20kHZ,22.1kHZ取样,16bit量化,经压缩后数据率为192kb/s。
● AC-3 5.1声道环绕立体声:频率带宽要求3kHZ~20kHZ,48kHZ取样,22bit量化,经压缩后数据率为320kb/s。
传输延时要求:当网络单程传输延时>24ms时,应采取措施消除可听见的回声干扰。
延时抖动要求:CD质量音频,网络延时抖动一般不应超过100ms。
电话质量语音,网络延时抖动不应超过400ms。
虚拟现时语音,网络延时抖动不应超过20ms~30ms。
流媒体:我们把采用流式传输的诸如视频、音频等连续时基多媒体称为流媒体,或称流式媒体。
流式传输的两种基本方法:
顺序流式传输:顺序下载,在线观看。放在HTTP和FTP服务器上。
实时流式传输:就是实时传送,适合于现场直播。需要专用的流媒体服务器。
流媒体的两种基本传输形式:点播和 广播(广播又分为单播和多播)
三大主流流媒体技术解决方案:RealNetworks公司的RealMedia.
Microsoft公司的WindowsMedia。
Apple公司的QuickTime
三、 前期音频采制器材
话筒:话筒即传声器,是指将机械波形式的声音信号转换为电信号形式的换能器件。
录音应用中主要采用电容式和动圈式。音乐拾音时多采用电容式。
按音频信号传输方式:有线话筒(平衡型-专业、三线型和非平衡型―消费、二线型)和无线话筒。
幻像供电:在调音台音频设备设置提供前置放大器工作电压和电容极化电压的电源。
话筒的主要性能指标:频响特性、灵敏度、指向性(全向、双向、心型、强心型、超指向)输出阻抗、最大输入声压级
适合人声拾音话筒:
演播室中访谈:频响范围:40Hz~15000Hz、心型或强心型、电容式或动圈式
室外、音乐会、体育比赛:强心型或超指向型、最大输入声压级>100dB
录音棚中:注意音的高质量语音拾取,用大面积振动膜片的话筒。
交响乐:全指向话筒
数字录音器材:磁带录音机、光盘录音机、硬盘录音机、闪存卡录音
光盘录音机:CD-R/CD-RW、DVD-RA、MD
四、 后期数字音频制作器材
调音台的功能作用:
● 对多路输入声音进行电平调整(动态调整)。
● 对输入声音进行频率均衡处理,美化修饰声音。
● 对各路声音进行混音处理(单声道、立体声及淡入淡出等处理)。
● 做输出分配,将多路输入声音信号的处理结果分别输出到不同的端口。
● 监听,借助监听系统确认所进行的处理是否达到预期效果。
数字音频工作站:是指将所有的以硬件和/或软件方式实现的后期音频制作功能模块、通过计算机的集中控制,形成一个系统化的、各模块的控制可以在计算机界面集中进行的数字
音频编辑/处理/混合/录音的系统,而且其性能指标上达到专业音频制作的要求。
五、计算机音频制作系统 组成
硬件:计算机、音频接口卡、话筒、数字音频录放设备、数字调音台和监听设备
软件:音频设备驱动程序、操作系统、数字音频工具软件、数字音频应用软件
音频接接口卡/盒:指计算机数字音频制作与处理系统中,主要用于实现计算机系统与各类模拟或数字音频设备、MIDI设备和监听设备等之间的音频信号传输的功能模块。
MIDI设备三在模块:合成模块(音源、合成器)
编辑模块(音序器、编曲器)
输入模块(各种MIDI乐器)
常用的音频文件格式:
● Wav格式:是Microsoft公司和IBM公司开发的波形声音文件存储格式。
● Wma/Asf/Asx/Wax格式:是Microsoft公司开发的网上流式数字音频存储格式。
● MP3格式:是德国Fraunhofer Institut fur Integrierte Schaltungen协会开发的。
● Rm/Ra/Rmx格式:是英国RealNetworks公司开发的新型流式音频文件格式。
● MIDI格式:是世界多家电子乐器公司开发的。
● Wrk格式:是Cakewalk Pro软件采用的MID文件存储格式。
习题:单选:
1、下列对于“掩蔽效应”表现出来的规律,说法不正确的是。【 】D
A、低音调的声音,会对高音调的声音产生较显著的掩蔽作用。
B、掩蔽声和被掩蔽声的频率越接近,隐蔽作用越大。
C、高音调的声音对低音调的声音只产生很小的掩蔽作用。
D、提高掩蔽声的声压级,有助于减小掩蔽作用的效果。
2、PCM是“数字化”的最基本技术,下列哪个选项不是其中的环节步骤。【 】 D
A、取样 B、 量化 C、 编码 D、 压缩
3、下列关于数字语音音频网络传输的带宽要求,描述正确的是。【 】B
A、普通语音,频率带宽〈=1.7KHZ。 B、高质量语音,频率带宽从50HZ~7KHZ。
C、普通语音,频率带宽>=7KHZ。 D、 高质量语音,频率带宽从3HZ~20KHZ。
4、按数字音频网络传输的要求,CD-DA双声道立体声带宽要求达到。【 】A
A. 22.1KHZ取样、16bit量化 B. 16KHZ取样、16bit量化
C. 8KHZ取样、16bit量化 D. 8KHZ取样、8bit量化
多选:
5、 下列对“哈斯效应”表现出的规律,描述正确的是。【 】ABCDE
A. 当直达声和反射声之间延迟时间超过100ms时,几乎所有的人都能觉察到回声。
B. 当直达声和反射声之间延迟时间大于70ms时,差不多一半人觉察到回声。
C. 当直达声和反射声之间延迟时间大于50ms时,人耳就能辨别出来自不同方向的两个独立的声音。
D. 当直达声和反射声之间延迟时间小于30ms时,一般人耳不能区分出来。
E. 当直达声的强度比反射声强度高10dB以上时,几乎没有人能感觉到回声。
6、与模拟化的信息相比较,数字化的音频信息具有那些优越性。【 】ABDE
A、能实现高效编码,利于节省存储空间。 B、抗干扰能力强,便于进行中继传输。
C、容易生成高声压级的声音。 D、便于加密,容易实现信息的保密或版权保护。
E、易于集成化和大规模生产。
7、 数字音频光盘存储技术中可用到的光盘类别有哪些。[CDE]
A、硬盘类 Bmp3制作、软盘类 C、LD类、 D、CD类 E、DVD类
8、调音台是音频后期制作的核心设备,其主要功能是。【 】[ABCDE]
A、对多路声音进行电平调整。 B、对各路声音进行混音处理。
C、做输出分配,将多路输入声音信号的处理结果分别输出到不同的端口。
D、监听,借助监听系统确认所进行的处理是否达到预期效果。
E、对输入声音进行频率均衡处理,美化修饰声音。
9、下列选项中属于计算机音频制作系统中软件系统部分的有哪些。【 】[BDE]
A、数字调音台 B、数字音频设备驱动程序 C、计算机主机
D、数字音频编辑处理程序 E、操作系统
10、下列有关常用音频文件格式及其所属开发公司的描述,正确的是。[ ACD]