与えられたデータや文から、人が話す音声を合成する技術。
近年劇的に発達。
人間が実際に話しているものとほぼ同等に自然な音声を生成することが可能になっている。
2016年にDeepMind社によって開発されたWaveNetは、サンプリングされた系列点としての音声をそのままDNNを用いて処理することで、近似や調整などの作業が不要になった。
音声合成のブレイクスルーとして注目されている。