[Paper Review] Style Tokens: Unsupervised style modeling, control and transfer in end-to-end speech synthesis
style embedding을 통해 Tacotron으로 합성한 음성의 스타일을 조절해보자
style embedding을 통해 Tacotron으로 합성한 음성의 스타일을 조절해보자
MOS를 예측하는 데 생기는 어려움들을 생각해보자
MBNet에서 단점을 파악하고 개선해보자
평가자 정보를 활용해 더 정확하게 MOS를 예측해보자
FastPitch에 source-filter 이론을 접목시켰다