最終更新:2024-04-10 (水) 16:02:42 (383d)
Llama 2
Top / Llama 2
https://llama.meta.com/llama2/
モデル
https://github.com/meta-llama/llama/blob/main/MODEL_CARD.md
GPU時間(h) Llama 2 70B 1720320 (196年) Llama 2 13B 368640 (42年) Llama 2 7B 184320 (21年)
トレーニング
- NVIDIA A100 80GB
モデル
速度
https://twitter.com/junrushao/status/1681828398841364481
- 7 tok/sec on Apple M2 Max?
- 9.8 tok/sec on Apple M2 Ultra
- 13 tok/s on an A100.