Deep Log - Page 4

Changjin Han

그냥 하는 사람이 가장 압도적이다

Recent posts

[Paper Review] Natural language guidance of high-fidelity text-to-speech with synthetic annotations

September 23 2024

Parler-TTS

[Paper Review] High Fidelity Neural Audio Compression

July 17 2024

SoundStream 보다 발전된 뉴럴 오디오 코덱

[Paper Review] SoundStream: An End-to-End Neural Audio Codec

July 03 2024

최초의 End-to-End 뉴럴 오디오 코덱

[Paper Review] Imaginary Voice: Face-styled Diffusion Model for Text-to-Speech

June 27 2023

사람의 얼굴에 어울리는 목소리를 자동으로 만들어주는 디퓨전 기반 TTS 모델

[Paper Review] VoiceMe: Personalized voice generation in TTS

June 26 2023

인물의 사진을 보고 어울리는 음성을 직접 제작할 수 있는 모델