多媒體技術/數字音頻的編碼

維基教科書,自由的教學讀本

一般情況下,聲音的製作是使用麥克風或錄音機產生的,再由聲卡上的WAVE合成器的模/數轉換器對模擬音頻進行採樣,然後量化編碼為一定字長的二進制數據序列,並在計算機內傳輸和存儲。在數字音頻回放時,再由數字到模擬的轉化器(數/模轉換器)解碼,將二進制編碼恢復成原始的聲音信號,通過音響設備輸出。
數字波形音頻文件是要佔用一定存儲空間的,其容量的計算可由公式完成。
數字波形文件的數據量非常大,這對大部分用戶來說都是不能接受的,要降低磁盤佔用,只有兩種方法,即降低採樣指標或者提高壓縮率。而降低採樣指標會影響音質,因此專家們研發了各種高效的數據壓縮編碼技術。
對於不同類型的音頻信號而言,其信號頻寬是不同的,如電話音頻信號為200Hz~3.4kHz,調幅廣播音頻信號為50Hz~7kHz,調頻廣播音頻信號為20Hz~15kHz,雷射唱盤音頻信號為10Hz~20kHz。隨着對音頻信號音質要求的增加,信號頻率範圍逐漸增加,要求描述信號的數據量也就隨之增加,從而帶來處理這些數據的時間以及傳輸、存儲這些數據的容量增加,因此多媒體音頻壓縮技術是多媒體技術實用化的關鍵之一。
音頻信號的壓縮編碼主要有熵編碼、波形編碼、參數編碼、混合編碼、感知編碼等。