音声処理は、音声認識と音声生成とに分けられる。

●音声認識
入力された音声波形からスペクトルを作成、数理モデルで内容を推定する。

●音声生成
人間の音声を人工的に合成すること。

深層学習(ディープラーニング)の技術が、現在の音声認識システムの高い性能を支えている。
スマートスピーカーなどの音声処理システムは、自然言語処理とセットで活用されている。