CD 품질을 상징하는 16 Bit / 44.1 kHz 는 음악을 제작하는 과정에서 이르게 되는 숫자들입니다. 그리고 어느순간 왜 하필이면 이 숫자들이야? 라고 궁금해집니다. 

 

아날로그 사운드를 디지털로 담아내는 과정에서, 또한 디지털 사운드를 다시 아날로그로 재생하는 과정에서 "16 Bit에 44.1 kHz 정도면 인간이 그 차이를 구별해내기 힘들고 그 이상은 무의미하다" 라는 것이 이 이야기의 핵심입니다. 

 

 

 

 

 

 

디지털 판 (Bit Depth x Sampe Rate)

 

자연의 아름다운 아날로그 신호를, 디지털 판에 가장 흡사하게 담아내고자 했고, 그 X, Y축을 이루는 값이 바로 Bit Depth와 Sample Rate입니다. 

Sample Rate는 1초동안 지나가는 사운드 신호의 샘플수를 이야기하는데, 결국 1초 길이의 사운드를 얼마나 많은 샘플로 나눌 것인가를 의미합니다. 따라서 44.1kHz는 1초라는 사운드 신호를 44,100개의 샘플로 나누었다는 이야기입니다. Bit Depth는 Sample Rate로 결정된 각 샘플에 담긴 정보의 양을 의미하는데, 16비트는 2진법이므로 십진법으로 2의 16제곱인 65,536개의 서로다른 정보를 뜻합니다. 이 때 구분선이 10개면 9개의 구간이 생기는 것처럼 65,535개의 구간이 발생한다는 뜻입니다.

 

따라서 16/44.1 은 아날로그 신호를 1초동안 44,100 x 65,535개의 격자로 이루어진 디지털판에 담고 있다는 말이 됩니다. 

 

16 Bit / 44.1kHz 보다 더 높은 값(이를테면 32 / 192) 으로 디지털 판을 만들면 훨씬 정교해 지겠죠. 

그리고 정교해질 수록 더욱 본래의 아날로그 신호에 가까워질 것입니다. 

그렇다면 왜 16과 44.1이라는 숫자로 특정된 것일까요?

 

 

 

 

적절한 Bit Depth

 

오디오 세계에서의 Bit Depth는 볼륨의 다이나믹 레인지 (Dynamice Range)를 뜻합니다. 1 Bit 당 약 6.02의 볼륨 다이나믹이 발생하므로, 16 Bit는 96.33dB의 다이나믹 레인지를 가집니다. 이를 표로 정리하면 다음과 같습니다. 

from Wikipedia

즉, 16 Bit = 약 96dB, 20 Bit = 약 120dB, 24 Bit = 약 144dB의 다이나믹 레인지를 가진다는 것을 알 수 있습니다. 

 

이때, 일상생활에서 다른 사람과 평범하게 대화하는 정도의 소리 크기가 60dB정도로 알려져 있으며, 음악을 들을 때에도 60~85dB 정도로 들어야 청력손실을 예방할 수 있다고 전문가들이 이야기합니다. 특히 90dB이상의 소리에 장시간 노출되면 영구적인 청력 손실을 입을 정도로 위험합니다. 

 

따라서, 16 Bit의 Bit Depth를 통해 96dB의 볼륨 다이나믹 레인지를 확보했다면, 우리가 듣는 60~85dB의 음악을 재생하는데에는 아무 문제가 없다는 뜻이 됩니다. 20 Bit나 24 Bit를 차용해서 96dB 이상의 다이나믹 레인지를 확보해도, 우리가 90dB 이상으로 잘 듣지 않기 때문에 큰 효과가 없다는 것이죠. 만약 같은 80dB정도의 볼륨으로 음악을 감상한다면, 16 Bit와 24 Bit를 구분할 수 있는 사람은 과학적으로는 없다고 봐도 무방합니다. 

 

(물론, 넓은 공간에 수많은 사람들이 몰려 있는 대형 콘서트 장이나 공연에서는 매우 큰 볼륨이 필요하므로 24 Bit이상의 다이나믹 레인지를 가진 음향 장비가 필요합니다. )

 

 

 

 

 

 

 

적절한 Sample Rate

 

사실 아날로그 신호와 디지털 신호를 변환하면서 손실이 없이 완벽하게 보존할 수 있는 개념은 이미 수학적으로 증명되어 있습니다. 바로 나이키스트-섀넌 샘플링 이론 (Nyquist–Shannon sampling theorem)인데요, 아날로그 신호를 디지털로 샘플링할 때에 원음 주파수의 2배가 필요하다는 이론입니다.

 

인간의 가청 주파수가 20Hz ~ 20kHz로 알려져 있으므로, 우리가 샘플링할 때에는 40kHz이 필요합니다.  

 

또한, 에일리어싱 (Aliasing; 아날로그 신호의 샘플링 시 표본화 주파수가 신호의 최대 주파수의 2배보다 작거나 필터링이 부적절하여 인접한 스펙트럼들이 서로 겹쳐 생기는 신호 왜곡 현상)을 방지하기 위해 10%정도의 여유를 두어, 44.1kHz로 정하게 되었습니다. 

 

사실 역사적으로는, 70년대 소니(Sony)와 필립스(Philips)의 오디오 시장에서의 대격돌에서 16 bit/ 44.1kHz를 밀었던 소니의 승리로 결판났으며, 1979년 양사 간 합의가 이루어지면서 시장 전체의 표준화가 확립되었습니다. 그리고 LP이후 2~30년간 음악은 CD에 담겨 생산되었고, 그동안 수많은 음원들이 16/44.1의 CD 형태로 제작되었죠. 이후 mp3는 이 CD음원을 기초로 변환 과정을 거쳤기에 인류는 거의 40년넘게 16/44.1의 세계에 귀가 익숙해져 왔습니다.

 

 

 

 

 

 

24 Bit / 96 kHz 고음질 음원 단상

 

소위 High-Resoultion Audio라고 불리는 고음질 음원 시장이 점점 커지고 있습니다.

 

인터넷과 저장매체의 발달로 용량의 제한이 사라지고, 과거 고가 였던 고급 오디오 기기들이 대중들이 접근하기 쉬운 가격대로 떨어지면서, 고음질 음원을 듣는데에 큰 문제가 없게되었기 때문입니다. 

 

과연 고음질 음원이 16/44.1 에 비해 더 좋은가? 에 대해서는 워낙 주관적인 의견들이 팽배하기 때문에 두 가지 고려사항만 조심스럽게 말씀드리고자 합니다. 

 

 

첫째로, Bit Depth는 볼륨의 다이나믹 레인지를 뜻하므로, 음악 애호가가 개인적인 공간에서 음악을 들을 때에는 16Bit 이상의 Bit Depth를 가져도 소용이 없습니다. 이 이유는 앞서 말씀드린 바와 같습니다. 

 

둘째로, Sample Rate가 높은 음원은 조금 다른 방식으로 마스터링되었을 확률이 높습니다. 음압 경쟁의 시대에서 mp3는 예전부터 최대한 음압을 끌어오린 형태로 제작되어 왔고, 16/44.1 wav도 이미 그 추세를 따른지 오래되었습니다. 따라서 우리가 평소 듣는 음원들의 대부분이 리미터로 음압을 최대한 끌어올린 상태로 제작되어 있습니다. 결국 볼륨을 높이기 위해 본래 음악의 다이나믹이 줄어들고, 초저역과 초고역대의 손실을 상당부분 감수하고 있다는 말이 됩니다.

 

같은 음원을 24/96으로 마스터링 했을때에는 엔지니어나 프로듀서가 '고급 장비를 가진 음악 애호가'라는 특정 집단을 염두하고 있으므로 리미터로 음압을 억지로 끌어올리려 하지 않고, 자연스러운 상태로 놔둘 확률이 높습니다. 즉, 음압을 높이지 않은 자연스러운 형태의 음원을 사용자가 볼륨을 높여 듣는다..라는 이상적인 형태가 구현 가능한거죠. (사실 음압경쟁은 마스터링에서 해야할 것이 아니라, 사용자들이 그냥 볼륨 게인을 높여서 들으면 그만입니다. )

 

이 말은 같은 음원이라도 16/44.1과 24/96의 마스터링 컨셉 자체가 다르고, 이를 감상한 사람들이 '다르다'고 느끼는 것은 당연하다는 것입니다. 

 

이 두 가지를 염두하시고 고음질 음원을 바라보셨으면 좋겠습니다. 

  • 하늘끝 2020.06.21 13:17

    재미있고 유익하게 잘 읽었습니다. 사람의 bit depth가 90db정도라는 것은 가청주파수가 한계가 20khz 처럼 일반적인 내용인가요? 사전에 그걸알고 있었어야 이 의문들이 해소되는군요. 좋은글 감사합니다.

    • BlogIcon 모노펫 2020.06.22 12:34 신고

      가청 데시벨이 따로 정해진 것은 없으나, 90dB이상의 소리에 장시간 노출시 영구적인 청력 손상을 입을 정도로 위험하다는 사실이 알려져 있습니다. 정상적인 평소의 대화가 60dB정도이고, 교통량이 많은 서울도심 한복판의 소음이 80dB정도로 생각하시면 이해가 쉬우실듯 합니다 :)