最終更新:2024-10-31 (木) 02:32:53 (39d)  

LLM/量子化
Top / LLM / 量子化

Qx - xビット量子化

フォーマット

llama.cpp形式 (形式:GGUF/ライブラリ:ggml)

メモ

  • q5_K_Mがバランスがよさそう

メモ

  • Kのついたものが「k-quant?メソッド」なる新方式による量子化モデル
    • K
    • K_S
    • K_M
    • K_L
  • Q4
  • Q5
    • Q5_K_S? (推奨)
    • Q5_K_M? (推奨)

GPTQ

TheBloke

メモ

関連

参考