最終更新:2024-12-01 (日) 07:59:27 (7d)  

Module LLM/Julius
Top / Module LLM / Julius

概要

  • Juliusと日本語認識キットのdictation-kitの最新版をビルドして動かしてみる
    • Julius 4.6? (2020/09/02)
    • dictation-kit 4.5? (2019/04/16)

Juliusのビルド

  • ビルド
    make
    make install # usr/local/binにインストール

dictation-kitのインストール

  • 公式はクソ遅いのでミラーからダウンロード
    wget https://ftp.jaist.ac.jp/pub/sourceforge.jp/julius/71011/dictation-kit-4.5.zip
    unzip dictation-kit-4.5.zip
    cd dictation-kit-4.5/
    julius -C main.jconf -C am-gmm.jconf -demo

動作の様子

  • 認識するようになったけど精度はいまいち。これはRaspberry Pi 4でやったときも同じ感じなので辞書を作ったりが必要っぽい
    • (RPi4の16KHzのほうが気持ち認識精度が高い気はするがそもまで高くはない)
      Stat: "default": Audio [Axera Audio] device 6051000.i2s_slv-actt 23f2000.audio_codec-0 [6051000.i2s_slv-actt 23f2000.audio_codec-0] subdevice #0
      STAT: AD-in thread created
      pass1_best:  今日 は
      sentence1:  こんにちは 。
      pass1_best:  おはよう ござい ま
      sentence1:  おはよう ござい ます 。
      <<< please speak >>>
  • ps
    USER         PID %CPU %MEM    VSZ   RSS TTY      STAT START   TIME COMMAND
    root      109679 12.7 16.0 172352 158000 ttyS0   Sl+  06:24   0:53 julius -C main.jconf -C am-gmm.jconf -demo

DNN?

  • $ julius -C main.jconf -C am-dnn.jconf -demo -dnnconf julius.dnnconf
    ...
    [44173.055365] Out of memory: Kill process 113714 (julius) score 625 or sacrifice child
    [44173.137849] Killed process 113714 (julius) total-vm:623492kB, anon-rss:613136kB, file-rss:4kB, shmem-rss:0kB
    Killed
  • Raspberry Pi 4で試したらメモリが1GBくらい必要な模様
    • 精度は多少良いが応答性がいまいちだった

ボリュームの調整

  • alsamixerを起動
  • F4 (Captureデバイスに切り替え)
  • 左右でRX RIGHTを選んで12になってたのを38にしたらちょうどいい音量になった

PCMデバイスが開けない場合

  • 下記のエラーが出るときはsystemctl stop llm-audio?
    Error: adin_alsa: cannot open PCM device "default" (Device or resource busy)
    failed to begin input stream

参考

関連