最終更新:2009-11-13 (金) 20:14:10 (5278d)  

ChaKi
Top / ChaKi

ChaKi(茶器)は、自然言語コーパスの構築、検索、および言語要素へのタグ付けをサポートするツール群です。

http://sourceforge.jp/projects/chaki/

ChaKi.NETには以下の特徴があります。

  • タグ付きコーパス対応
    • ChaSen, MeCabによる形態素解析済みテキスト、およびCabocha?による係り受け解析済みテキストを主要な 入力とし、形態素係り受け?といった「タグ」を組み合わせた条件によるKWIC検索・表示・統計機能を持っています。
  • マルチRDB対応
    • ChaKi LegacyはMySQLのみに対応していましたが、Client-ServerでないファイルベースのDBであるSQLiteをはじめ、 各種Client-Server型のRDB?MySQL, SQLExpress?, PostgreSQL)から自由に選択が可能となっています。 DBタイプは、コーパス単位で自由に組み合わせることができ、異なるタイプのDBを横断して検索することが可能です。
  • SLAT(Segment and Link-based Annotation Tool)とのDBスキーマ統合(予定)
    • アノテーション機能を強化するため、SLATで採用されているSegment, Link, Groupをベースとした アノテーションをサポートします。従来「文節」と「係り受け関係」とで表現していた係り受けデータは SegmentとLinkによる表現形式に変更されました。

マニュアル

関連

  • KWIC?