新闻资讯

DSD:Direct Stream Digital高解析数字音频编码

2021-11-04 16:06:27 5

DSD (直接比特流数字)

DSD是Direct Stream Digital的缩写,表示直接比特流数字编码,是SACD(Super Audio CD)的编码模式。它是Sony与Philips在1996年宣布共同发展的高解析数字音响规格。

DSD(Direct Stream Digital)『直接比特流数字』,它是Sony与Philips在1996年宣布共同发展的高解析数字音响规格, DSD新技术与DVD的音响技术指针竞争,用1bit比特流的方式取样,采样率2.8224MHz(CD 44.1kHz取样的64倍)的高取样方式,直接把模拟音乐讯号波形以脉冲方式转变为数字讯号,以将近四倍于CD的空间,储存音乐,因此可以提供更为优秀的声音效果,由于取样次数高,所以取样过的波形很圆顺,比较接近原来的模拟波形。再者由于不采用多位,省去位转换程序,降低了因为数字滤波而可能产生的失真与噪声。还有,由于不像多位系统般容易(位愈高就愈容易)受到电源或外部干扰的影响,因此理论上质量会比较稳定。当前的SACD player,兼容性,无论您是DSD支持者或是传统CD的拥护者,都将是双赢的局面。 SACD(Super Audio CD)是新一代数码音响规格,以超高速取样(2.8224MHz,为CD的64倍)声音以0和1连续的量子化,可听频域的动态范围约为120dB,可能收录频域约1000kHz,结合了传统模拟的温暖及超高的分辨率,Chesky独家呈现的96k/24bit技术高水平音效,绝对让重视音响效果的您,有超值的视听感受。 SACD多声道的音质包含了6个独立的音轨,每一个音轨都可以读到没有经过任何压缩而完整的DSD规格(Full DSD Bit Rate),也就是说,您的每一支喇叭都可以听到立体环绕的效果(一般的DVD由于经过压缩,所以仅能听到96K/24Bit的音质)。

DSD与线性PCM的区别

PCM(Pulse-Code Modulation,脉冲编码调制)是最为常见的一种音频编码格式,什么wav,ape,flac,mp3等等几乎所有常见音频都是PCM编码格式。

其原理简单来说,先准备好一组规定电平值(对于电平这个概念,可以简单地等同理解为电压),如-3,-2,-1,0,1,2,3等等,每个值给一个编号,就像ABCD这样,不过我们给这些电平值使用二进制的编号(就是000 001 010 等等)。

然后从先前的那组规定电平内,采用四舍五入的办法找出最接近采样电平的值,然后记录下来这个最接近值的编号,然后进行下一次采样..如此反复,就能用一组二进制编号(也就是数字信号)把麦克风过来的原始模拟信号给记录下来了,记录下来的数字信号就是PCM了。

上面的整个过程就是常说的ADC编码过程,录音室里的录音过程就是这样了。

这整个过程中输出信号与输入信号间的差叫做量化误差.量化误差对于信号而言是一种噪声,所以也被称为量化噪声。

PCM就是这样,每个采样点都是去度量一个绝对值,采样点之间相互独立无关联。

对于CD中使用的16bit 44.1kHz的PCM,就是对信号每秒钟取样44100次,然后用一组65536(就是16bit,2的16次方)个值的规定电平去度量取样电平,在这么高的取样频率和16位规定电平的精度下,记录下来的信号和原信号已经是非常之接近的了(至少大部分人耳分辨不出区别了)。

我们还可以通过加大取样率和增加规定电平的精度来更好的记录原信号,比如常见的24bit 88.2kHz,96kHz,192kHz,以及32bit 96khz。

但是PCM这种方式还是有瓶颈,量化噪声平均分布在全部频段上,就算继续极大地提升精度和采样率,也难以减少更多的噪声了。

为了全面改善脉冲编码调制数字音频技术,获得更好的声音质量,就需要有新的技术来替换,于是我们有了DSD。

对于16bit PCM,每记录一个采样点需要用到16bit数据,但是DSD对于每一个采样点,用1bit就可以记录,也就是说,仅仅用表示“否”的“0”和表示“是”的“1”去记录这一个采样点的电平值。

DSD的编码过程中,对信号进行量化的方式和PCM完全不一样。

此处引入Δ调制概念,,不像PCM那样用一组规定电平值去度量,而是只使用一个固定值"Δ"去度量原始信号.依然是隔一段固定时间取一次样,每次取样得到的电平会拿来与上一次取样的信号进行比较,如果其插值大于Δ,则输出"1",如果插值小于Δ或者为负数,则输出"0".于是就这样,每个采样点就能以1bit的形式被记录下来。

Δ调制有着一个缺点,就是随着输入模拟信号的频率增高,信噪比会急剧下降.我们可以通过减小Δ的值,并且增大采样率,来控制量化噪声.

图1 Δ调制器(Sigma-Delta Modulator)

图1 Δ调制器(Sigma-Delta Modulator)

DSD的主体思想就是这样,每一个采样的值是上一个采样的相对值,前后采样点相互连系密不可分.这种量化方式的思想因为其连续性,更加接近自然中的声音(声音信号就是一连串的,单独一个点毫无意义)。

为了克服Δ调制的缺陷,发展出了∑-Δ调制器(Sigma-Delta Modulator)

如图1,如果我们在信号的输入端再加一个差分器,信号从差分器正相输入,然后通过一个积分器,然后到Δ调制器(A/D),把Δ调制后的结果进行一次D/A转换,并且延时输入到差分器的反相端作为反馈,这就是一个完整的∑-Δ调制器了。

整体的量化方式思路还是和Δ调制类似,不过反馈回差分器反相输入端的电平为整个信号的最大值或最小值(即Δ调制输出1,则反馈回Vmax,输出0,则反馈回Vmin,两者均为固定值),就是说积分器积分的是输入电平与最高/低电平的差值,然后我们再对积分后结果进行一次Δ调制(可以把原信号当成是某函数f(x)的导数,然后我们对f(x)来进行Δ调制量化,这样也许会更好理解一点)。

这样一来,量化的对象就变成了当前信号电平和先前所有差值和的差值,量化电平不再会受频率影响,最大量化范围直接取决于电平值。

反馈中加入的延时电路使得∑-Δ调制器有着噪声整形的特征,一阶的∑-Δ调制器的噪声整形效果不明显,但是我们可以把多阶∑-Δ调制器叠加到一起,使得噪声整形效果达到一个较高水平.这个噪声整形的具体结果就是,量化噪声总体量没有变,但是不是平均分布在所有频段上,低频段的量化噪声会较少,而高频的量化噪声会较多.也就是说,量化噪声被"推挤"到了高频中.在音频应用中,大部分量化噪声被推挤到了远超过20kHz的高频,也就是人耳听不到的频段,利用一个低通滤波就可以很简单地把这些噪声给干掉了。

这就是DSD相对于PCM的最大优势,极小的量化噪声,超高的信噪比

DSD就是经过了以上的∑-Δ调制而得到的数字信号,如果把这一连串数字信号放在同一标尺上和原始信号相比,会发现数字"0"和"1"随着信号电频的增减程度而密度产生相应变化,所以DSD也称成为是脉冲密度调制(Pulse Density Modulation)

打个比方,PCM是对着原图去描点,但是这个描点你再怎么精确总是会有点小误差,而DSD就是对着原图画轮廓,但是这个轮廓比PCM的描点更精确

虽然DSD比起PCM有着种种优势,但是有个硬伤,录音后期混音制作的时候无法使用DSD呐,只有PCM才能做混音处理。

所以几乎所有的录音室所用母带还是PCM格式,混音完成了以后再压缩成DSD格式,制作成SACD,这个过程实际上已经丢掉了DSD的大半优势。

不经处理的纯DSD直录音频,真的是少之又少,多为录音室的试音产品。

所以说,DSD的路,还非常漫长。