最終更新:2025-05-13 (火) 09:30:51 (2d)
Qwen3-30B-A3B
Top / Qwen3-30B-A3B
https://huggingface.co/Qwen/Qwen3-30B-A3B
概要
- 総パラメータ数300億(30B)、有効パラメータ数30億(3B)
量子化
GGUF
- Q4_K_M
Ryzen AI Max+ 395 52.89tok/s Apple M1 Ultra 49tok/s Apple M1 Max 49tok/s Snapdragon X Plus 30tok/s
MLX
- 4bit
Apple M4 Max 87.58 toks/s Apple M3 Ultra 76.32 toks/s Apple M2 Ultra 68.51 toks/s Apple M1 Ultra 60 toks/s Apple M1 Max 60 toks/s - SoC性能の関係でメモリに載る分を動かすならMLXはM4 Maxの方がM3 Ultraより15%ほど高速
Apple M4 Max 4bit 95tok/s Apple M4 Max 4bit 100tok/s https://x.com/akkikiki/status/1917695559063802059
https://x.com/rewse/status/1917582322993619184