最終更新:2024-05-09 (木) 12:35:12 (9d)  

LLM/量子化
Top / LLM / 量子化

Qx - xビット量子化

フォーマット

llama.cpp形式 (形式:GGUF/ライブラリ:ggml)

メモ

  • q5_K_Mがバランスがよさそう

メモ

  • Kのついたものが「k-quant?メソッド」なる新方式による量子化モデル
    • K
    • K_S
    • K_M
    • K_L

GPTQ

TheBloke

メモ

関連

参考