検索

クイックアクセス

チラ裏

おなかすいた族！

リンク

人気の50件

最終更新:2025-03-05 (水) 15:40:26 (135d)

LLM
LLM/ベンチマーク
Top / LLM / ベンチマーク

モデルの性能について

LLM/モデル/ベンチマーク

処理速度とか

GPU-Benchmarks-on-LLM-Inference

GeForce RTX 5090

https://x.com/umiyuki_ai/status/1891356818846151057

llama.cpp

Performance of llama.cpp on Apple Silicon M-series

https://github.com/ggerganov/llama.cpp/discussions/4167

LMSYS Chatbot Arena Leaderboard

Apple M1 Ultra

LLM/VRAM

M1 Ultra 128GB の場合、98.3GB
M2 Ultra 192GB の場合、142.5GB よりわずかに小さい

https://www.reddit.com/r/LocalLLaMA/comments/16cm537/falcon_180b_on_the_older_mac_m1_ultra_128_gb/

モデル

Model Quantized size (4-bit) Original size (f16)
7B 3.82 GB 12.63 GB
13B 7.24 GB 24.41 GB
30B 17.84 GB 63.7 GB
65B 35.5 GB 122.48 GB
70B 36.37 GB 128.3 GB

Falcon 180B Chat - GGUF

Q4 K_M : 108.48 GB
Q3 K_L : 91.99 GB