最終更新:2010-09-22 (水) 04:50:29 (3607d)  

Galatea
Top / Galatea

http://hil.t.u-tokyo.ac.jp/~galatea/index-jp.html

http://sourceforge.jp/projects/galatea/

Galatea Project は、擬人化音声対話エージェントのツールキット Galatea Toolkit を開発し、オープンソース、ライセンスフリーで公開提供するプロジェクトで、国内の十数大学などの音声・言語・画像研究者が参加して進めています。顔、声、音声合成テキスト、認識文法、対話の流れなどはカスタマイズ可能で、これを用いて容易に人間の顔と表情を持ち、音声で対話する自分独自のエージェントを作成することができます。

Galatea Toolkit の概要

  • 擬人化音声対話エージェント(spoken-language anthropomorphic agent) の類語としては、アバター(avatar)、 模擬人間?(life-like agent, human-like agent, software humanoid)、 仮想現実人間・バーチャル人間?(virtual human)、 サイバーエージェント(cyber-agent)、 サイバー人間・サイバーヒューマン?(cyber-human)、 ディジタルヒューマン(digital human) などがあります。 本ツールキットの特徴は、音声対話と顔画像に重点を置き、オープンな環境を提供することです。
  • 擬人化音声対話エージェントのツールキット Galatea Toolkit の 主要な構成要素は、
    • 音声認識 ........ ユーザが話す音声を認識します。 認識対象内容は文法を与えて指定でき、場面によって切替えが出来ます。
    • 音声合成 ........ 日本語の漢字仮名混じりテキストから 音声を合成し出力します。この種の初のオープンソース、フリーソフトです。 Galatea Talk デモのサイト もお試しください。
    • 顔画像合成 ........ 一枚の顔写真から3次元立体の顔画像を作り出し、 表情を変え、音声に合わせて口を動かします。
    • 対話制御 ........ ユーザとエージェントの対話の流れを記述します。 音声認識語彙、音声合成内容、顔の表情などを統合的に記述します。 などです.これらの機能を「Galatea アーキテクチャ」のもとに統合して動作させます.
  • 研究のプラットフォームとして利用されることを想定して カスタマイズ可能性を重視した結果, 以下のような特長を持つシステムとなっています.
    • 顔画像が容易に交換可能
    • 音声合成が話者適応可能 (新しい音声合成方式(HMM音声合成)を開発)
    • 対話制御の記述変更が容易
    • 機能モジュール自体を別のモジュールに差し替えることが容易
    • 処理ハードウェアの個数の追加に柔軟に対処できる
    • Linux 版と Windows 版を提供
    • Linux 版は VoiceXML? による対話記述が可能
    • Windows 版は GUI によるプロトタイピングツールを提供

ドキュメント

関連