DL/Voice

[Voice] 디지털 신호(음성) 처리 개념 정리 (3) - 16 Bit, 44.1 kHz / PCM

moonzoo 2024. 6. 12. 13:48

디지털 판(Bit Depth x Sample Rate)

아날로그 신호를 디지털 판에 흡사하게 담아내고자 하였고, 그 X, Y축을 이루는 값이 Bit Depth와 Sample Rate 입니다.

Sample Rate는 1초동안 지나가는 신호의 샘플수를 이야기하는데, 1초 길이의 사운드를 얼마나 많은 샘플로 나눌 것인가를 의미합니다.

 

Bit Depth는 Sample Rate로 결정된 각 샘플에 담긴 정보의 양을 의미하는데, 16비트는 2의 16제곱인 65,536개의 서로 다른 정보를 뜻합니다. 즉, 63,535개의 구간이 발생한다는 뜻입니다.

 

따라서, 16 Bit / 44.1kHz는 아날로그 신호를 1초동안 44,100 x 65,535개의 격자로 이루어진 디지털 판에 담고 있다는 말이 됩니다.

 

WHY? 16Bit / 44.1kHZ

오디오 장비나 CD를 보면 16 Bit / 44.1kHz라는 수치를 주로 접할 수 있습니다. 이러한 수치를 표준으로 사용하는 이유는 16 Bit에 44.1kHz 정도면 인간의 청각 범위를 넘는 주파수와 동적 범위를 포함하고 있기 때문입니다.

 

44.1kHz 샘플링 주파수

  • 정의: 샘플링 주파수는 아날로그 오디오 신호를 디지털로 변환할 때 1초당 측정하는 샘플의 수를 의미합니다. 44.1kHz는 초당 44,100번의 샘플을 채취한다는 의미입니다.
  • 용도: 44.1kHz는 CD 오디오의 표준 샘플링 주파수로, 대부분의 음악 및 오디오 재생 장치에서 사용됩니다. 이 주파수는 인간의 청각 범위(약 20Hz에서 20kHz)를 충분히 커버할 수 있는 샘플링 속도를 제공합니다.

16비트 해상도

  • 정의: 비트 깊이는 각 샘플이 얼마나 많은 정보를 포함할 수 있는지를 나타냅니다. 16비트는 각 샘플이 65,536가지의 서로 다른 값을 가질 수 있음을 의미합니다.
  • 용도: 16비트 해상도는 CD 오디오의 표준 비트 깊이로, 충분히 높은 동적 범위(96dB)를 제공하여 대부분의 음악 콘텐츠에서 좋은 품질을 유지할 수 있습니다.

(사실 과거 오디오 시장에서 16 Bit / 44.1kHz로 밀고 나갔던 소니가 필립스와의 경쟁에서 승리하고, 1979년에 양사가 합의하여 시장 전체의 16 Bit / 44.1kHz가 확립됐습니다. 그리고 이 시대에 음악은 cd에 담겨 생간되었고, 그 음원들이 16 Bit / 44.1kHz로 제작되었기 때문에 우리들이 16 Bit / 44.1kHz에 익숙해져있기 때문이라고도 합니다.)

 

PCM

PCM(Pulse Code Modulation)은 아날로그 신호를 디지털 신호로 변환하는 과정 및 방식입니다. 이는 디지털 오디오 시스템의 기본 기술 중 하나로, 소리와 같은 아날로그 신호를 디지털화하여 컴퓨터와 같은 디지털 장치에서 처리, 저장, 전송할 수 있게 합니다.

PCM의 주요 단계

  1. 샘플링(Sampling)
    • 아날로그 신호를 일정 시간 간격으로 측정하여 디지털 값으로 변환합니다.
    • 샘플링 주파수는 1초당 측정하는 샘플의 수를 의미합니다. 예를 들어, CD 품질의 오디오는 44.1kHz의 샘플링 주파수를 사용합니다.
  2. 양자화(Quantization)
    • 샘플링된 아날로그 신호를 이산적인 디지털 값으로 변환하는 과정입니다. 나이퀴스트 이론에 의해 주파수의 두배로 샘플링하여 양자화하면 나중에 다시 얻고자 하는 신호로 되돌릴 수 있습니다.
    • 샘플별 양자화값의 범위는 bit로 표시하고, CD의 경우 16 bit로 표현되며 65,535개로 샘플을 쪼갠다는 의미입니다. 단, bit수가 커진다고 볼롬이 올라가는 것은 아니고 더 세밀하게 양자화한다고 할 수 있습니다.
    • 각 샘플 값은 가장 가까운 디지털 값으로 반올림됩니다.
  3. 인코딩(Encoding)
    • 양자화된 값을 이진수 형태로 변환하여 디지털 데이터를 생성합니다.

PCM_8 (8비트 PCM)

  • 비트 깊이: 8비트
  • 디지털 값의 범위: 각 샘플이 256(2^8)개의 서로 다른 값 중 하나로 표현됩니다.
  • 동적 범위: 약 48dB (일반적으로 6dB/비트로 계산)
  • 파일 크기: PCM_16보다 작음
  • 용도: 저품질 오디오 애플리케이션, 초기 디지털 오디오 형식, 전화 음성 신호 등

PCM_16 (16비트 PCM)

  • 비트 깊이: 16비트
  • 디지털 값의 범위: 각 샘플이 65,536(2^16)개의 서로 다른 값 중 하나로 표현됩니다.
  • 동적 범위: 약 96dB
  • 파일 크기: PCM_8보다 큼
  • 용도: 고품질 오디오 애플리케이션, CD 오디오, 음악 제작 등

CD의 양자화 크기는 16bit, 2바이트이므로 각 샘플별로 2바이트를 사용하게 됩니다. 따라서 CD 수준의 음질(16bit 44.1khz)에서 1초의 음악을 기록하는 데 필요한 용량은

2(스테레오) * 2(양자화크기) * 44100(샘플링레이트) = 176,400 바이트 (1411.2kbps)로 계산할 수 있습니다.