多媒体技术/数字音频的编码

维基教科书,自由的教学读本

一般情况下,声音的制作是使用麦克风或录音机产生的,再由声卡上的WAVE合成器的模/数转换器对模拟音频进行采样,然后量化编码为一定字长的二进制数据序列,并在计算机内传输和存储。在数字音频回放时,再由数字到模拟的转化器(数/模转换器)解码,将二进制编码恢复成原始的声音信号,通过音响设备输出。
数字波形音频文件是要占用一定存储空间的,其容量的计算可由公式完成。
数字波形文件的数据量非常大,这对大部分用户来说都是不能接受的,要降低磁盘占用,只有两种方法,即降低采样指标或者提高压缩率。而降低采样指标会影响音质,因此专家们研发了各种高效的数据压缩编码技术。
对于不同类型的音频信号而言,其信号带宽是不同的,如电话音频信号为200Hz~3.4kHz,调幅广播音频信号为50Hz~7kHz,调频广播音频信号为20Hz~15kHz,激光唱盘音频信号为10Hz~20kHz。随着对音频信号音质要求的增加,信号频率范围逐渐增加,要求描述信号的数据量也就随之增加,从而带来处理这些数据的时间以及传输、存储这些数据的容量增加,因此多媒体音频压缩技术是多媒体技术实用化的关键之一。
音频信号的压缩编码主要有熵编码、波形编码、参数编码、混合编码、感知编码等。