【AI】Microsoftがわずか数秒のサンプルから会話や歌声を再現できる音声合成AI「NaturalSpeech 2」を発表 [すらいむ★]

【AI】Microsoftがわずか数秒のサンプルから会話や歌声を再現できる音声合成AI「NaturalSpeech 2」を発表 [すらいむ★] at SCIENCEPLUS

1:すらいむ ★
23/04/20 21:59:59.47 gUcFWSYB.net
Microsoftがわずか数秒のサンプルから会話や歌声を再現できる音声合成AI「NaturalSpeech 2」を発表

　2023年4月18日にMicrosoft Research AsiaとMicrosoft Azureのカイ・シェン氏らの研究チームが拡散モデルを使用した小品質の音声合成システム(TTS)である「NaturalSpeech 2」を発表しました。
　NaturalSpeech 2では数秒の短い音声サンプルを利用する事で、人の声だけでなく歌声までも忠実にシミュレートすることが可能になっています。

　[2304.09116] NaturalSpeech 2: Latent Diffusion Models are Natural and Zero-Shot Speech and Singing Synthesizers
　URLﾘﾝｸ(doi.org)

（以下略、続きはソースでご確認ください）

Gigazine 2023年04月20日 20時00分
URLﾘﾝｸ(gigazine.net)

レスを読む