跳至內容

多媒體技術/音頻的數字化

維基教科書,自由的教學讀本

數字化音頻技術就是把表示聲音強弱的模擬信號(電壓)用數字來表示。通過採樣量化等操作,把模擬量表示的音頻信號轉換成許多二進制「1」和「0」組成的數字音頻文件,從而實現數字化,為計算機處理奠定基礎。數字音頻技術中實現A/D(模/數)轉換的關鍵是將時間上連續變化的模擬信號轉變成時間上離散的數字信號,這個過程主要包括採樣(Sampling)、量化(Quantization)和編碼(Encoding)3個步驟。

採樣

[編輯]

每隔一定時間間隔不停地在模擬音頻的波形上採取一個幅度值,這一過程稱為採樣。而每個採樣所獲得的數據與該時間點的聲波信號相對應,稱為採樣樣本。將一連串樣本連接起來,就可以描述一段聲波了。

量化

[編輯]

經過採樣得到的樣本是模擬音頻的離散點,這時還是用模擬數值表示。為了把採樣得到的離散序列信號存入計算機,必須將其轉換為二進制數字表示,這一過程稱為量化編碼。
量化的過程是:先將整個幅度劃分成有限個小幅度(量化階距)的集合,把落入某個階距內的採樣值歸為一類,並賦予相同的量化值。
量化的方法大致有兩類:

  • 均勻量化:均勻量化採用相等的量化間隔來度量採樣得到的幅度。這種方法對於輸入信號不論大小一律採用相同的量化間隔,其優點在於獲得的音頻品質較高,缺點在於音頻文件容量較大。
  • 非均勻量化:非均勻量化對輸入的信號採用不同的量化間隔進行量化。對於小信號採用小的量化間隔,對於大信號採用大的量化間隔。雖然非均勻量化後文件容量相對較小,但對於大信號的量化誤差較大。

編碼

[編輯]

編碼即編輯數據,就是考慮如何把量化後的數據用計算機二進制的數據格式表示出來。實際上就是設計如何保存和傳輸音頻數據的方法,例如MP3、WAV等音頻文件格式就是採用不同的編碼方法得到的數字音頻文件。