最終更新:2010-09-22 (水) 04:50:29 (5329d)
Galatea
Top / Galatea
http://hil.t.u-tokyo.ac.jp/~galatea/index-jp.html
http://sourceforge.jp/projects/galatea/
Galatea Project は、擬人化音声対話エージェントのツールキット Galatea Toolkit を開発し、オープンソース、ライセンスフリーで公開提供するプロジェクトで、国内の十数大学などの音声・言語・画像研究者が参加して進めています。顔、声、音声合成テキスト、認識文法、対話の流れなどはカスタマイズ可能で、これを用いて容易に人間の顔と表情を持ち、音声で対話する自分独自のエージェントを作成することができます。
Galatea Toolkit の概要
- 擬人化音声対話エージェント(spoken-language anthropomorphic agent) の類語としては、アバター(avatar)、 模擬人間?(life-like agent, human-like agent, software humanoid)、 仮想現実人間・バーチャル人間?(virtual human)、 サイバーエージェント(cyber-agent)、 サイバー人間・サイバーヒューマン?(cyber-human)、 ディジタルヒューマン(digital human) などがあります。 本ツールキットの特徴は、音声対話と顔画像に重点を置き、オープンな環境を提供することです。
- 擬人化音声対話エージェントのツールキット Galatea Toolkit の 主要な構成要素は、
- 音声認識 ........ ユーザが話す音声を認識します。 認識対象内容は文法を与えて指定でき、場面によって切替えが出来ます。
- 音声合成 ........ 日本語の漢字仮名混じりテキストから 音声を合成し出力します。この種の初のオープンソース、フリーソフトです。 Galatea Talk デモのサイト もお試しください。
- 顔画像合成 ........ 一枚の顔写真から3次元立体の顔画像を作り出し、 表情を変え、音声に合わせて口を動かします。
- 対話制御 ........ ユーザとエージェントの対話の流れを記述します。 音声認識語彙、音声合成内容、顔の表情などを統合的に記述します。 などです.これらの機能を「Galatea アーキテクチャ」のもとに統合して動作させます.
- 研究のプラットフォームとして利用されることを想定して カスタマイズ可能性を重視した結果, 以下のような特長を持つシステムとなっています.