인간의 가청주파수 영역
인간의 가청주파수 영역은 일반적으로 20Hz에서 20,000Hz (20kHz) 사이입니다. 나이가 들수록 고주파수에 대한 청력이 감소하는 경향이 있습니다. 어린 아이들은 20kHz까지 들을 수 있지만, 성인은 대개 16kHz 이상은 잘 들을 수 없습니다.
사람은 100~10,000Hz의 주파수 범위를 갖는 목소리를 낼 수 있으며, 회화가 가능한 범위는 200~6,000Hz 영역, 대화가 명료한 범위는 500~2,500Hz 영역이라고 할 수 있다. 그러므로 AICC에 전자기기와 대화가 이뤄지는 AICC의 음성은 8000Hz(8kHz)에서도 충분히 커버가 가능하다.
나이퀴스트 이론 (Nyquist-Shannon)
Nyquist-Shannon 이론이란, 신호는 그 신호에 포함된 가장 높은 진동수의 2배에 해당하는 빈도로 일정한 간격으로 샘플링하면 원래의 신호로 복원할 수 있다는 샘플링 이론입니다.
일반적인 신호는 아날로그 신호인데, 컴퓨터가 처리하기 위해선 이를 디지털 신호로 바꿔줘야합니다. 그러나, 이 디지털 신호로 바꿔주는 과정에서 신호의 손실이 없어야 일반적인 신호와 가까운 신호로 얻을 수 있습니다.
아날로그 신호를 디지털화 하는 과정을 ADC(Analog to Digital Convertion)라고 합니다. 다음은 ADC 과정에 대한 그림입니다.
그림에서는 샘플링된 신호를 양자화 시킵니다. 양자화는 여러 단계로 나뉜 범위 안에서 샘플링된 신호에 가까운 범위를 대표하는 정수 값으로 바꾸는 것입니다. 이 과정에서 나오는 오차가 양자화 오차입니다.
양자화 오차 때문에 신호를 복원했을 때,기존 아날로그 신호와는 차이가 존재하는 신호를 얻게됩니다. 기존 아날로그 신호의 유실 없이 복원되기 위해서는 가장 빠른 주파수의 2배이상으로 샘플링 해야합니다. 이것이 나이퀴스트 주파수로, 이를 통해 샘플링된 신호를 아날로그 신호로 다시 복원하면 기존 신호와 유사함을 확인할 수 있습니다.
앨리어싱 현상
앨리어싱(Aliasing) 현상은 신호 처리에서 발생하는 왜곡 현상으로, 샘플링 주파수가 신호의 최대 주파수 성분의 두 배보다 낮을 때 발생합니다. 앨리어싱 현상이 발생하면 원본 신호의 고주파 성분이 낮은 주파수 성분으로 잘못 해석되어 신호에 왜곡이 생기게 됩니다. 이 왜곡은 복원 과정에서 원본 신호를 제대로 재구성할 수 없게 만듭니다.
앨리어싱은 신호가 샘플링 주파수의 절반을 초과하는 주파수 성분을 포함할 때 발생합니다. 이를 Nyquist 주파수라고 하며, 샘플링 주파수의 절반입니다. 예를 들어, 샘플링 주파수가 40kHz라면 Nyquist 주파수는 20kHz입니다. 이 경우 20kHz를 초과하는 주파수 성분은 샘플링 후 잘못된 저주파 성분으로 나타납니다.
이로인해, 항상 신호의 최대 주파수 성분의 두 배 이상으로 샘플링하여 앨리어싱을 방지합니다.(Nyquist-Shannon 샘플링)
요약
- 표본화 정리: 아날로그 신호를 디지털 신호로 변환할 때, 원본 아날로그 신호를 정확하게 재구성하기 위해 샘플링 주파수는 원본 신호의 최대 주파수 성분의 두 배 이상이어야 합니다.
- Nyquist 주파수: 샘플링 주파수의 절반을 의미하고, 이 주파수 이상을 초과하는 신호 성분은 샘플링 과정에서 왜곡됩니다 (즉, 앨리어싱 현상이 발생).
- 샘플링 조건: 신호가 주파수 f까지의 주파수 성분을 포함하는 경우, 샘플링 주파수 fs는 최소한 2f (즉, Nyquist 속도)이어야 합니다.
이를 수학적으로 표현하면, 샘플링 주파수 fs가 신호의 최대 주파수 fmax의 두 배 이상이어야 한다는 의미입니다:
이러한 이론을 통해 디지털 신호 처리에서 인간의 가청 주파수 범위인 20Hz에서 20kHz의 신호를 디지털화하려면 최소한 40kHz로 샘플링해야 한다는 결론이 나옵니다.
'DL > Voice' 카테고리의 다른 글
[Voice] 딥러닝 음성 처리 파이썬 실습 - 16K / 8K 비교, 음성 데이터 연산 (0) | 2024.06.12 |
---|---|
[Voice] 디지털 신호(음성) 처리 개념 정리 (3) - 16 Bit, 44.1 kHz / PCM (1) | 2024.06.12 |
[Voice] 음성 데이터 1D Convolution 설명 및 코드 (7) | 2024.03.12 |
[Voice] CNN (Convolutional neural network) 간단 설명 (4) | 2024.03.12 |
[Voice] 디지털 신호(음성) 처리 개념 정리 (2) | 2024.03.12 |