音声情報処理

年度 2002
科目名 音声情報処理
教員名 柴山 秀雄
授業概要 音声には、発声者が意図した言葉の意味内容の他、誰が話しているのかという話者情報や話し手の感情などの種々の情報も含まれている。音声による対話は人と人との最も自然で、容易かつ効率的な情報交換手段である。人とコンピュータの間でも、音声を用いて対話が出来るようにならば、極めて便利であり、現在、その技術が実用化されようとしている。今後のマルチメディア環境のコミニュケションの中で最も自然に使いこなしているメディアとして、音声伝達手段は将来もその重要性は変わらないであろう。音声情報処理の分野は、音声分析、音声符号化、音声合成、話者認識などに大別することが出来るが、これらに関わる技術はそれぞれに密接な関係がある。音声処理の対象は自然科学的情報処理分野の側面と同時に高度な工学的情報処理を取り扱う分野であり、授業では音声生成モデルや音声知覚モデルを基礎と理論を駆使した音声情報処理に関する方法論を学ぶ事になる。
授業計画 音声情報の基礎

音声の基本的性質

発生器官の構造

生成モデル

音声の物理的性質

音声情報処理の概要

音声分析

音声分析の原理

相関関数とスペクトル

線形予測モデルによる分析

声道断面積関数の推定

音声符号化

音声符号化の原理

時間領域での符号化

周波数領域での符号化

音声合成

音声合成の原理

録音合成

パラメータ合成

テキスト合成

音声認識

音声合成の原理

音響処理

DPマッチング

ニュ-ラルネットワークによる方法

話者認識

話者認識の原理

テキスト依存型話者認識

テキスト独立型話者認識

テキスト指定型話者認識

評価方法 出席率は規定値を満足する事。授業中に与えた課題のレポートと試験結果により評価する
教科書
参考書
メッセージ 目標をたて、それを成し遂げてみようという強い意志があれば、目的の50%は達成したようなもの。残りは行動と知識欲。