最終更新:2010-08-12 (木) 04:16:22 (5334d)
MIST
Top / MIST
Media Integration Standard Toolkit
http://mist.suenaga.m.is.nagoya-u.ac.jp/trac/
http://mist.suenaga.cse.nagoya-u.ac.jp/document/main.html
MISTって何?
音声と画像のメディア統合を支援する標準ライブラリを目指しています. 別に,音声のみや画像のみでも使えるライブラリです. 音声・画像にかかわる研究をしようとした場合,研究に必要となるアルゴリズムを収集しなくてはならないことが多々あります. そこで,そのようなアルゴリズムをできるだけ網羅的に集め(計算性能や精度なども含めて),皆さんに提供しようというものです. 特に,これまで名古屋大学で開発されたアルゴリズムを重点的に集めるつもりです. また,それらのアルゴリズムを統一的なインターフェースで扱うことができるようにし,利用者の開発効率向上を目指しています.
関連
MISTの基本設定
- 基本設定
- MIST全般で利用できるコールバック関数
MISTで提供する基本コンテナ
- array : STLに準拠したメモリ上で連続となる1次元配列であり,音声・画像の全てのデータの基底クラス
- array1 : 音声を扱うための1次元配列
- array2 : 2次元画像を扱うための画像クラス
- array3 : 3次元画像を扱うための画像クラス
- bitmap : ビットマップ画像を扱うためのクラス
- marray : 1・2・3次元画像の縁にマージンを持った画像を扱うクラス
- buffered_array : 画像の一辺が2の指数乗となる画像を扱うクラス
- matrix : 任意の行列を扱うためのクラス(Expression template を利用した高速な演算が可能)
- ベクトル演算を可能とするクラス
- vector2 : 2次元ベクトルを扱うクラス
- vector3 : 3次元ベクトルを扱うクラス
- vector : N次元ベクトルを扱うクラス
MISTで提供する基本データ型
- バイナリ画素
- 色空間を扱うクラス
- カラー画素
- Windows用のビットマップで利用されるカラー画素
- カラー画素(アルファ付き)
- ステレオ音声?
- クォータニオン(四元数)
- 集合
- ポリゴン?関連
- ポリゴンを扱うクラス
- ポリゴンの集合を扱うクラス
- ポリゴン数の削減
MISTで提供するアルゴリズム
実装補助
ベクトル・行列演算?
共通の処理
- フーリエ変換
- ウェーブレット変換
- 統計処理
- 擬似乱数?生成
- グラフ描画(2次元)
- 画像や基本オブジェクトの描画
- OpenGLを用いた2次元画像描画
- 直線・円の描画
- 関数の最小化
- レジストレーション?
- 非剛体レジストレーション
- 可視化
- ボリュームレンダリング?
- 等濃度面表示
- キャリブレーション
- 機械学習
- Multiclass AdaBoost
- 経験的モード分解およびヒルベルト変換
主に画像に対して適用される処理
入出力系
- 任意の画像データの読み込み・書き出し
- RAWデータの読み込み・書き出し
- BMPデータの読み込み・書き出し
- PNMデータの読み込み・書き出し
- JPEGデータの読み込み・書き出し
- PNGデータの読み込み・書き出し
- GIFデータの読み込み
- TIFFデータの読み込み・書き出し
- TGAデータの読み込み・書き出し
- DICOMデータの読み込み・書き出し
フィルタ系
- 線形フィルタ?
- メディアンフィルタ
- 領域拡張法
- 画像補間
- 最近傍型補間
- 平均値型補間
- 線形補間
- 3次補間(sinc関数の3次近似を利用した補間)
- 3次のBスプライン補間?
- sinc関数補間(全画素を畳み込むので計算コスト大)
- エッジ検出
- Canny?エッジ検出器
- コーナー検出
- Harris?コーナー検出器
- カラー画像?に対する処理
- インターレス?除去
- 閾値選択
- モルフォロジー演算
- 2値画像?に対する処理
主に音声に対して適用される処理
入出力系
- 音声データの読み込み・書き出し
- WAVデータの読み込み・書き出し
フィルタ系
- サンプリングレート?変更
- 再生