Deep Log

그냥 하는 사람이 가장 압도적이다

[Paper Review] Imaginary Voice: Face-styled Diffusion Model for Text-to-Speech

June 27 2023

사람의 얼굴에 어울리는 목소리를 자동으로 만들어주는 디퓨전 기반 TTS 모델

June 26 2023

인물의 사진을 보고 어울리는 음성을 직접 제작할 수 있는 모델

January 12 2022

한국어의 발음특성을 고려한 FFNN G2P 모델

January 11 2022

Diffusion Probabilistic Model 기반 decoder를 사용한 TTS 모델

January 04 2022

contrastive learning을 활용한 중국어 G2P