音声情報処理

年度 2010
科目名 音声情報処理
教員名 柴山 秀雄
授業概要 音声には、発声者が意図した言葉の意味内容の他、誰が話しているのかという話者情報や話し手の感情などの種々の情報も含まれている。音声による対話は人と人との最も自然で、容易かつ効率的な情報交換手段である。人とコンピュータの間でも、音声を用いて対話が出来るようになれば、極めて便利であり、現在、その技術が実用化されようとしている。今後のマルチメディア環境のコミニュケションの中で最も自然に使いこなしているメディアとして、音声伝達手段は将来もその重要性は変わらないであろう。音声情報処理の分野は、音声分析、音声符号化、音声合成、話者認識などに大別することが出来るが、これらに関わる技術はそれぞれに密接な関係がある。音声処理の対象は自然科学的情報処理分野の側面と同時に高度な工学的情報処理を取り扱う分野であり、授業では音声生成モデルや音声知覚モデルを基礎と理論を駆使した音声情報処理に関する方法論を学ぶ事になる。
授業計画 音声情報の基礎
I .音声の基本的性質
II .発生器官の構造
III .生成モデル
IV .音声の物理的性質
V .音声情報処理の概要
音声分析
I .音声分析の原理
II .相関関数とスペクトル
III .線形予測モデルによる分析
IV .声道断面積関数の推定
音声符号化
I .音声符号化の原理
II .時間領域での符号化
III .周波数領域での符号化
音声合成
I .音声合成の原理
II .録音合成
III .パラメータ合成
IV .テキスト合成
音声認識
I .音声合成の原理
II .音響処理
III .DPマッチング
IV .ニュ-ラルネットワークによる方法
話者認識
I .話者認識の原理
II .テキスト依存型話者認識
III .テキスト独立型話者認識
IV .テキスト指定型話者認識
評価方法 2回のレポートと期末試験との合計点で評価する。(レポート:15点×2)+ 期末試験:70点)=100点とし、総合得点が60%以上を合格とする。出席率は評価点には無関係であるが、期末試験の受講資格は授業数の67%以上を出席した場合に限る。
教科書
参考書
メッセージ 目標をたて、それを成し遂げてみようという強い意志があれば、目的の50%は達成したようなもの。残りは行動と知識欲。