디지털 판(Bit Depth x Sample Rate)
아날로그 신호를 디지털 판에 흡사하게 담아내고자 하였고, 그 X, Y축을 이루는 값이 Bit Depth와 Sample Rate 입니다.
Sample Rate는 1초동안 지나가는 신호의 샘플수를 이야기하는데, 1초 길이의 사운드를 얼마나 많은 샘플로 나눌 것인가를 의미합니다.
Bit Depth는 Sample Rate로 결정된 각 샘플에 담긴 정보의 양을 의미하는데, 16비트는 2의 16제곱인 65,536개의 서로 다른 정보를 뜻합니다. 즉, 63,535개의 구간이 발생한다는 뜻입니다.
따라서, 16 Bit / 44.1kHz는 아날로그 신호를 1초동안 44,100 x 65,535개의 격자로 이루어진 디지털 판에 담고 있다는 말이 됩니다.
WHY? 16Bit / 44.1kHZ
오디오 장비나 CD를 보면 16 Bit / 44.1kHz라는 수치를 주로 접할 수 있습니다. 이러한 수치를 표준으로 사용하는 이유는 16 Bit에 44.1kHz 정도면 인간의 청각 범위를 넘는 주파수와 동적 범위를 포함하고 있기 때문입니다.
44.1kHz 샘플링 주파수
- 정의: 샘플링 주파수는 아날로그 오디오 신호를 디지털로 변환할 때 1초당 측정하는 샘플의 수를 의미합니다. 44.1kHz는 초당 44,100번의 샘플을 채취한다는 의미입니다.
- 용도: 44.1kHz는 CD 오디오의 표준 샘플링 주파수로, 대부분의 음악 및 오디오 재생 장치에서 사용됩니다. 이 주파수는 인간의 청각 범위(약 20Hz에서 20kHz)를 충분히 커버할 수 있는 샘플링 속도를 제공합니다.
16비트 해상도
- 정의: 비트 깊이는 각 샘플이 얼마나 많은 정보를 포함할 수 있는지를 나타냅니다. 16비트는 각 샘플이 65,536가지의 서로 다른 값을 가질 수 있음을 의미합니다.
- 용도: 16비트 해상도는 CD 오디오의 표준 비트 깊이로, 충분히 높은 동적 범위(96dB)를 제공하여 대부분의 음악 콘텐츠에서 좋은 품질을 유지할 수 있습니다.
(사실 과거 오디오 시장에서 16 Bit / 44.1kHz로 밀고 나갔던 소니가 필립스와의 경쟁에서 승리하고, 1979년에 양사가 합의하여 시장 전체의 16 Bit / 44.1kHz가 확립됐습니다. 그리고 이 시대에 음악은 cd에 담겨 생간되었고, 그 음원들이 16 Bit / 44.1kHz로 제작되었기 때문에 우리들이 16 Bit / 44.1kHz에 익숙해져있기 때문이라고도 합니다.)
PCM
PCM(Pulse Code Modulation)은 아날로그 신호를 디지털 신호로 변환하는 과정 및 방식입니다. 이는 디지털 오디오 시스템의 기본 기술 중 하나로, 소리와 같은 아날로그 신호를 디지털화하여 컴퓨터와 같은 디지털 장치에서 처리, 저장, 전송할 수 있게 합니다.
PCM의 주요 단계
- 샘플링(Sampling)
- 아날로그 신호를 일정 시간 간격으로 측정하여 디지털 값으로 변환합니다.
- 샘플링 주파수는 1초당 측정하는 샘플의 수를 의미합니다. 예를 들어, CD 품질의 오디오는 44.1kHz의 샘플링 주파수를 사용합니다.
- 양자화(Quantization)
- 샘플링된 아날로그 신호를 이산적인 디지털 값으로 변환하는 과정입니다. 나이퀴스트 이론에 의해 주파수의 두배로 샘플링하여 양자화하면 나중에 다시 얻고자 하는 신호로 되돌릴 수 있습니다.
- 샘플별 양자화값의 범위는 bit로 표시하고, CD의 경우 16 bit로 표현되며 65,535개로 샘플을 쪼갠다는 의미입니다. 단, bit수가 커진다고 볼롬이 올라가는 것은 아니고 더 세밀하게 양자화한다고 할 수 있습니다.
- 각 샘플 값은 가장 가까운 디지털 값으로 반올림됩니다.
- 인코딩(Encoding)
- 양자화된 값을 이진수 형태로 변환하여 디지털 데이터를 생성합니다.
PCM_8 (8비트 PCM)
- 비트 깊이: 8비트
- 디지털 값의 범위: 각 샘플이 256(2^8)개의 서로 다른 값 중 하나로 표현됩니다.
- 동적 범위: 약 48dB (일반적으로 6dB/비트로 계산)
- 파일 크기: PCM_16보다 작음
- 용도: 저품질 오디오 애플리케이션, 초기 디지털 오디오 형식, 전화 음성 신호 등
PCM_16 (16비트 PCM)
- 비트 깊이: 16비트
- 디지털 값의 범위: 각 샘플이 65,536(2^16)개의 서로 다른 값 중 하나로 표현됩니다.
- 동적 범위: 약 96dB
- 파일 크기: PCM_8보다 큼
- 용도: 고품질 오디오 애플리케이션, CD 오디오, 음악 제작 등
CD의 양자화 크기는 16bit, 2바이트이므로 각 샘플별로 2바이트를 사용하게 됩니다. 따라서 CD 수준의 음질(16bit 44.1khz)에서 1초의 음악을 기록하는 데 필요한 용량은
2(스테레오) * 2(양자화크기) * 44100(샘플링레이트) = 176,400 바이트 (1411.2kbps)로 계산할 수 있습니다.
'DL > Voice' 카테고리의 다른 글
[Voice] pyVoIP - Python으로 작성된 VoIP 라이브러리 (1) | 2024.09.20 |
---|---|
[Voice] 딥러닝 음성 처리 파이썬 실습 - 16K / 8K 비교, 음성 데이터 연산 (0) | 2024.06.12 |
[Voice] 디지털 신호(음성) 처리 개념 정리 (2) - 나이퀴스트 이론 / 앨리어싱 현상 (0) | 2024.06.12 |
[Voice] 음성 데이터 1D Convolution 설명 및 코드 (7) | 2024.03.12 |
[Voice] CNN (Convolutional neural network) 간단 설명 (4) | 2024.03.12 |