PCM和DSD對比,誰的音質更好?

一直以來,很多Hi-Fi發燒友在聊音樂的時候,經常會談論到關於音樂文件採樣、位深、碼率的相關技術參數。44.1kHz/16bit96kHz/24bit192kHz/24bit這種PCM波形規格到底意味着什麼?DSD這種全新的規格音質有何優勢?隨着越來越多初燒開始接觸數字音樂,本期就以純理論的角度為大家對比一波WAVDSD兩種文件給大家進行參考。
相信不少的朋友都知道44.1kHz是採樣率參數,但卻不知道到底什麼是採樣率。所謂採樣率,則是錄音設備每秒採集聲音樣本信息的頻率。44.1kHz採樣率,即是在錄音時,設備每秒記錄44100次。
為什麼無損音樂的採樣率會被定位44.1kHz?這其實並非偶然。根據奈奎斯特採樣定理(為了不失真地恢復模擬信號,採樣頻率應該不小於模擬信號頻譜中最高頻率的2倍),採樣率44.1KHz的數字音頻格式可以無損地記錄22.05KHz以下頻率的音頻信號,其剛好超過了人耳的聽力範圍20kHz。對於PCM波形來說更高的採樣率意味着曲線更加接近真實。
DSD64的採樣率為2.8244MHz,相等換算的話就是CD44.1kHZ64倍採樣率,也就是2824400/秒。與PCM脈衝編碼調製不同的是,DSD在錄製時使用PWM脈衝寬度調製,因此在圖像呈現上來看也與PCM有所不同,具體筆者會在下面討論。
上面提到採樣率是每秒記錄聲音的次數。對於用數字波形記錄聲音的方式來說,如果橫軸是時間,想要出現完整的波形,那麼就需要一個縱軸參數來為波形的高度進行設定。對於音頻來說,這個高度信息,就是Bit(位深)。

所謂16Bit,其真實含義是用16位的二進制數來表示採樣點的電平(縱軸高度)。在PCM波形中,縱軸高度越高、聽感的響度就越高。位深對音樂文件的動態表現一般直接掛鈎,16比特整數可以儲存216次方(65536)個不同的數值,每增加1比特代表縱軸的精密度翻一倍。

相比於DSD來說,PCM技術於很早之前就應用於音頻領域,因此其文件有很多的變種。正常的無損無壓縮PCM波形的文件是WAV,我們日常下載到的flacape這種無損格式都是將WAV文件無損傷壓縮的音樂檔案,再次解壓縮後數據基本不受影響(但不少數字音樂檔案發燒玩家發現聲音有打折扣的情況)。mp3wma等格式為有損壓縮格式,再次解壓為WAV後會造成數據損失。
PCMDSD本質有何不同?
PCMDSD在錄音時使用的就是兩種完全不同的系統;PCM脈衝編碼調製:首先將連續的模擬信號(音樂原聲)離散並抽樣量化,根據瞬時點參數構建PCM波形。簡單、直觀、文件佔用空間低是它的優勢,其劣勢在於量化誤差較大。
DSD在錄製時使用了另外一種調製——PWM脈衝寬度調製:它是將模擬信號轉換為脈波的一種全新的記錄方式。在記錄時,DSD的模數轉換A/D部分並非如WAV一樣,而是通過採樣點實現增/不變/減的判斷。打個比方吧,讓PCMPWMDSD調製技術)一起記數字,PCM在記錄一串數字時是1,2,3,4,3,而PWM則是0,1,1,1,-1(只取差值)。

PCMDSD的讀取方式
PCM波形的橫軸為採樣點、縱軸為位深,在做放音的數模轉換D/A時,數字波形中的每個點會轉換成其獨有的二進制編碼被指定的DSP或者CPU進行處理實現轉換。對於PCM波形來說,由於每次採樣都有嚴格的時間限制,因此PCM系統在聲音回放時對晶振的需求的極高,如果解碼時兩方出現任何誤差都會導致失真。同時,由於採樣率遠低於DSD,其在取樣時的受量化誤差影響,其理論上的信噪比也遠低於DSD
DSD文件的PWM波形在橫縱軸設置上與PCM相同。不同的是,PWM波形的採樣點深度僅為1bit,播放方式為錄製的逆過程(具體參考2.1)。相對於PCM來說,DSD的優勢是有效的防止了晶振問題,且動態響應也更加精準。不過由於其過於精準的特性,音樂的響度一般來說也是偏低的,這也是為什麼不少Hi-Fi產品會專門為DSD播放專門做一個增益功能。還有就是DSD的文件佔用空間巨大、解析耗電量大,非常吃硬盤資源。

兩種數字音頻編碼區別?
CD技術一樣,DSDDirect Stream Digital,直接比特流數字編碼)同樣是由索尼和飛利浦兩大技術巨頭聯手開發的數字音頻技術。那麼兩者之間有什麼因緣和異同呢?
首先,我們可以把數字音頻文件的基本數據單元,理解為採樣點,播放數字音頻文件的本質,就是讀取每個採樣點上記錄的數據。在同一個數字音頻文件中,每個採樣點間的時間間距,都是相同、固定的,因此,每一秒內採樣的次數越多,就意味着採樣頻率越高,記錄的數據量也就越大,重放音樂的信息量和音樂品質也就越好(理論上)。
當然,不同的音頻技術,採用的數據記錄方式也是不同的;以我們日常接觸最多的CD為例,本質是一種PCMPulse-Code Modulation,脈衝編碼調製)音頻的載體,所以這裡也先簡單介紹PCM技術的編碼原理。在對音頻信息進行記錄時,PCM的做法,是先按照一定的數據位深(數據值數量),設定一組電平值數據規則,然後按這個規則,對每個採樣點的電平值進行單獨記錄;從中我們可以理解:
1. 每個採樣點,都是單獨度量各自採樣時刻的電平絕對值,採樣點之間相互獨立,無關聯也無影響;
2. 數據位深越大,意味着電平值規則的數據量越大,每個採樣點的數據記錄也就越精細、豐富;
3. 採樣頻率越高,也就是採用的採樣率越高,同樣意味着採樣數據更豐富,更接近原音原貌。

常規的CD文件是16bit 44.1kHzPCM音頻,也就是每秒鐘取樣44100次,並且用一組65536個值(=216次方=16bit)的規定電平,測量和記錄採樣時刻的電平值。
DSD,可以理解為是一種PDMPulse-Density Modulation,脈衝密度調製)技術,在每個採樣點,DSD文件只進行2個值(=1bit)的數據記錄,記錄的內容則是相比上一個採樣點記錄數值的信號電平變化(增大還是減小)。
相比PCM技術,DSD每個採樣點只需做1bit位深的「1/0」記錄,同時採樣點之間數據互相關聯,整首音頻從開始到結束都可以視為是一個連貫、連續的整體(而不是如PCM那樣每個採樣點的數據本質各自獨立);當然,DSD也採用了遠遠高於PCM的採樣頻率,例如常規使用的DSD64,採樣率是2.8224MHz,也就是每秒鐘進行2824400次的採樣記錄,採樣密度是CD64倍。

兩者相比,PCMDSD其實各有千秋。一方面,DSD技術的數據採樣記錄方向更為線性,時間密度也更高,採集到的數據量也先天較大,因此即便是SACD所採用的(最常規、入門的)DSD64音頻,對比CD這樣的傳統PCM音頻,在多個方面也都已經具有優勢;而另一方面,無論PCM還是DSD,最終的聲音品質其實還是取決於數據量,而數據量又直接取決於使用的採樣率和位深,因此採用更高採樣率和數據位深、數據容量更大的PCM音頻,在聽感上其實也一樣可達到極高清;並且,音頻的後期製作,編碼、解碼時芯片的時鐘精確度等技術問題,也都會對音頻的最終播放品質造成影響。
事實上,對於消費者們來說,對待PCMDSD音頻,其實也沒必要一定要分出個結果。目前市面上的高清音頻,依然是以各類PCM音頻為主流,但也不乏以DSD形式發行的作品,因此,一台能夠同時玩轉PCMDSD讀解播放的高品質數字播放器,無疑將會是發燒玩家們不可缺少的數字音源。

相比於WAVDSD雖然是理論上的信息量升級,但也為解碼設備的性能帶來了更大的挑戰。不開玩笑的說,有一套能夠發揮真正DSD實力音響設備的人,筆者身邊的專業用戶都很少,更別提便攜聽音了。Hi-Fi設備並非玄學,它也是一分錢一分貨的。就像很多人玩手游都能充個萬八千一樣:如果捨不得錢一步玩到位,那就一點一點升級Hi-Fi設備。如果把自己限制在一定範圍內,永遠無法發現外面世界的美好。