Dither,數字音樂處理上非常神奇的技巧,通過用少數的Bit達到與較多Bit同樣的聽覺效果。
概述,原理,Dither抖動,
概述
Dither是數字音樂處理上非常神奇的技巧,目的是通過用少數的Bit達到與較多Bit同樣的聽覺效果,方法是在最後一個Bit(LSB)上動“手腳”。例如用16Bit記錄聽起來好似20Bit的信息,聽到原先16Bit無法記錄的微小信息。舉例來說,現在我有個20Bit的採樣信息,現在想將其存為16Bit的信息格式,最簡單的轉換方式就是直接把後面4個Bit去掉,但是這樣就失去用20Bit錄音/混音的意義。比較技巧性的方法是在第17~20Bit中加入一些噪音,這段噪音就叫做Dither。這些噪音加入後,可能會進位而改變第16個Bit的信息,然後我們再把最後4個Bit刪掉,這個過程我們稱為redithering,用意是讓後面4個Bit的數據線性地反映在第16個Bit上。由於人耳具有輕易將噪音與樂音分離的能力,所以雖然我們加入了噪音,實際上我們卻聽到了更多音樂的細節。
我們通過一個比喻來讓大家了解Dither,我們通過手指間的細縫只能看到眼前部分的圖像,但是如果前後揮動手掌,就可以通過不同時刻看到的整個圖像的各個部份,從而在大腦中建構出完整的圖形信息,這就是大腦神奇的地方。Dither與此類似,但不是簡單的理論就可以說得清楚的。在眾多的Dither技術中,索尼(SONY)公司的SBM(Super Bit Mapping,超級數碼映像)、LIVE STUDIO RECORDINGS的ULTRA MATRIX PROCESSING(超級矩陣處理)都是專攻20Bit轉16Bit的技術。Dither的數字音訊處理用途非常廣泛,凡是兩個波形的相加、振幅的縮放、Normalize都會用到。現在的錄音室已經發展到24Bit錄音,在這個音樂CD還是主流儲存媒體的時代,Dither還是非常重要的技術。順便提一下,在影像處理領域,將24Bit的全彩圖像以16Bit的高彩畫面顯示也會用到Dither的技術。
原理
人耳對具有周期性的聲音、頻譜上特別突出的頻率(formant)、隨時間變化而移動的突出頻率特別敏感。當聲音從高解析度降低為低解析度的時候,捨棄末尾 bit 所造成增加的 quantization error,會和原本的聲音訊號有高度的關連性;,會造成很明顯的泛音失真,人耳對這種突出的泛音失真會很敏感。
dither 在音訊中加入所造成的是一種 white noise,也就是能量在各個頻率都一樣的 noise。這種 noise 是隨機的、亂序的、不規則的,我們對這種訊號,大腦會認為這是比較不重要的、沒有意義的、無法 tracking 的,所以會自動降低對它的敏感度,直接把它忽視掉。
所以我們就利用這樣的特性,在由高解析度轉為低解析度之前,先對原始的聲音訊號加入一個隨機的雜訊,這個雜訊會增加整體的雜訊量,但是會不規則打破原本的 quantization error,消除 quantization error 和原本訊號之間的關連也就是用我們比較可以忍受、比較不會去注意到的沙沙沙的white noise,去取代原本突出的泛音失真。
Dither抖動
高質量的數字音頻系統必須具有大的動態範圍。也就是說,它們必須能夠忠實地重現非常大和非常小的聲音,如音樂所要求的那樣。在數字音頻套用中,動態範圍定義為:
動態範圍=20log(最大信號值/能夠從噪音中分辨出來的最小信號值)
動態範圍主要取決於數字系統所採用的比特數,然而,可以採取其它一些能夠進一步擴展數字音頻系統的回響能力的技術,這其中就有抖動和壓擴。
在量化過程中,每一個模擬採樣必須映射到與它最接近的可用的數字電平。一個適當的信號能夠以合理的精度捕捉到,但是小信號有可能完全丟失。抖動(Dither)通過另一種策略來改善這種情況,即採樣之前在模擬信號上加上少量的白噪音。噪音的頻譜是平坦的。量化後,信號的形狀具有新的奇妙的特性。信號的原始形狀可以通過計算這些點的滑動平均恢復。這樣,信號在量化電平附近的變化就變得更明顯,更多的信號原始特徵被保留了下來。對於那些幅度小於一個量化步長的小信號來說,這種作用尤其有益,否則信號有可能完全丟失。
抖動還有另一個好處。對於大多數信號,量化誤差被假定是隨機的,並且獨立於被編碼的信號。這種假設導致量化噪音幅度的根均方(rms)值為Q/根下12,Q代表量化步長。遺憾的是,正弦輸入的量化誤差與信號並不是獨立的,實際是以相同的周期變化的。結果在已量化的信號中就會出現與輸入信號的諧波相聯繫的失真。當在正弦信號上加入抖動後,量化噪音就被隨機化了,但這要求抖動噪音的根均方幅度最好為Q/根下12才能得到這種效果。抖動的加入使噪音至少增加了一倍,也就意味著總信噪比改變了10log(1/2)=-3dB。加上抖動後,信噪比降低為6.02N-1.24dB。儘管如此,其優點在於,在整個奈奎斯特頻帶內噪音頻譜是平坦的,對於重要信號諧波的平均影響較小。