본문 바로가기
공부/ML

음성 신호 처리 관점에서 Fourier Transform

by 기찬이즘 2024. 11. 14.
반응형

오디오에서 신호는 일반적으로 amplitude - time을 축으로 가지는 가변파이다. 즉, 소리의 진폭이 시간에 따라 어떻게 변하는지 보여주는 파형이라고 보면된다. 이러한 time domain에서의 신호는 위 사진에서도 볼 수 있듯이  분석하기가 매우 까다롭기 때문에 뭘 할 수 가 없다. 하지만 이러한 신호를 주파수 단위에서 관찰한다면 특정 주파수 대역에 여러가지 처리를 해서 노이즈를 제거하거나 음성을 추출하거나 하는 등 다양한 일을 할 수 있게된다. 따라서  Fourier Transform은 음성 신호처리에 있어서 필수적인 기술이라고 보면 되겠다.

 

디지털 오디오에서 우리는 샘플링된 데이터를 처리하는데, 이는 연속 오디오 파형이 이산 지점으로 표현된다는 것을 의미한다. DFT는 이러한 이산 지점을 통해 신호의 주파수를 표현하게 된다. 만약 우리가 N개의 샘플 (이산 지점)을 가지고 있다고 할 때 DFT는 아래의 식에 의해 얻어질 수 있다.

 

위식은 기본적으로 복소 지수 인자가 곱해진 각 샘플 x[n]을 합산합니다. 이 가중치는 신호를 여러 주파수로 분리할 수 있으며 각 X[k]는 주파수 구성 요소를 나타낸다. 

반응형