最終更新:2024-04-03 (水) 16:03:37 (37d)
LLM/VRAM
LLM
Llama 2
Falcon
- Falcon 180B?
重みの精度?
バイト ビット 倍精度 double 8 64 単精度 float/float32 4 32 普通はこれ 半精度 float16 2 16 INT8 8 INT4 4 GPTQ 3
VRAM
メモ
- 混合精度?