본문 바로가기
반응형

공부/ML2

음성 신호 처리 관점에서 Fourier Transform 오디오에서 신호는 일반적으로 amplitude - time을 축으로 가지는 가변파이다. 즉, 소리의 진폭이 시간에 따라 어떻게 변하는지 보여주는 파형이라고 보면된다. 이러한 time domain에서의 신호는 위 사진에서도 볼 수 있듯이  분석하기가 매우 까다롭기 때문에 뭘 할 수 가 없다. 하지만 이러한 신호를 주파수 단위에서 관찰한다면 특정 주파수 대역에 여러가지 처리를 해서 노이즈를 제거하거나 음성을 추출하거나 하는 등 다양한 일을 할 수 있게된다. 따라서  Fourier Transform은 음성 신호처리에 있어서 필수적인 기술이라고 보면 되겠다. 디지털 오디오에서 우리는 샘플링된 데이터를 처리하는데, 이는 연속 오디오 파형이 이산 지점으로 표현된다는 것을 의미한다. DFT는 이러한 이산 지점을 통해.. 2024. 11. 14.
ONNX(Open Neural Network Exchange)에 대한 이해 ONNX는 다양한 ML 프레임워크 간 변환에 사용되는 중간단계의 ML 프레임워크라고 보면된다.예를 들어, TensorFlow에서 TensorRT로 변환하고 싶거나 PyTorch에서 TFLite와 같은 다른 머신 러닝 프레임워크로 변환할 때 ONNX는 각 프레임워크들 사이에서 중간다리 역할을 할 수 있다. 그래서 이런 중간다리가 왜 필요한가? 라는 질문이 생길 수 있다.Inference 단계에서 ML 모델을 최적화를 하려면 하드웨어 기능을 최대한 활용하기 위해 학습된 모델과 라이브러리를 최적해야할 필요가 있다. 이 때 클라우드, 엣지, CPU, GPU 등과 같은 다양한 플랫폼에서 최적의 성능을 얻고자 할 때, 각 플랫폼들은 서로 다른 기능과 특성이 있기 때문에 프레임워크가 제각각이면 각 프레임워크의 모델을.. 2024. 11. 8.
반응형