最終更新:2025-05-18 (日) 05:37:57 (44d)
Jetson AGX Orin
Top / Jetson AGX Orin
https://www.nvidia.com/ja-jp/autonomous-machines/embedded-systems/jetson-orin/
Llama 2
Llama 2 70B 4.4tok/s Llama 2 13B 22.2tok/s Llama 2 7B 42.5tok/s https://huggingface.co/TheBloke/Llama-2-7B-Chat-GPTQ
- 4bit GPTQ
Llama 3 8B
- 最大 40 トークン/秒