STT 2

[Voice] 실시간 STT 연구를 위한 선행 지식과 학습 로드맵 (feat. Whisper)

0. 개요"실시간 STT" Real time STT 또는 Streaming STT 라고도 불립니다. "[Voice] 실시간 STT 연구를 위한 선행 지식과 학습 로드맵" 에서는 지금까지 실시간 STT를 구현하기 위해 필요한 여러 선행 연구와 개념들을 순차적으로 정리하고자 합니다.1. OpenAI/Whisper 실시간 STT에 적합하지 않다.현재 ASR 분야에서 가장 성능이 뛰어나다고 알려진 모델은 OpenAI의 "Whisper"입니다.Whisper는 CNN과 트랜스포머를 결합한 구조를 가지고 있습니다. 이러한 구조를 가진 Whisper를 일반적으로 적용 가능한 모델로 훈련하기 위해 OpenAI는 다양한 환경과 녹음 설정, 화자, 언어를 포함한 680,000 시간 이상의 레이블 데이터를 수집했습니다. 이를..

DL/Voice 2024.12.03

[AI Tech] AICC(컨텍센터)에서 인바운드와 아웃바운드란?

https://mz-moonzoo.tistory.com/48 [AI Tech] AICC 아키텍처, VoIP Infra, AI 시스템 구성. AICC는 인공 지능(AI) 기술을 활용하여 고객 서비스를 자동화하고 최적화하는 최신 콜센터 솔루션입니다. AI, 머신러닝, 자연어 처리(NLP) 등의 기술을 통해 고객의 요구를 예측하고, 개인화된 서비 mz-moonzoo.tistory.com 이전 포스팅에서 AICC 아키텍처에 대해 작성했는데요, 해당 아키텍처에 대한 프로세스는 인바운드에 초점을 맞춰서 작성했습니다. 이번 포스팅에선 AICC에서 인바운드와 아웃바운드가 무엇인지에 대해 작성하고자 합니다. AICC 인바운드 AICC에서 인바운드란 인공지능(AI)을 활용하여 인바운드 통화(고객이 직접 전화를 걸어오는 경..

AI Tech 2024.02.14