検索

クイックアクセス

チラ裏

おなかすいた族！

リンク

人気の50件

最終更新:2025-05-13 (火) 09:30:51 (66d)

Qwen3
Qwen3-30B-A3B
Top / Qwen3-30B-A3B

https://huggingface.co/Qwen/Qwen3-30B-A3B

概要

総パラメータ数300億(30B)、有効パラメータ数30億(3B)

量子化

https://huggingface.co/lmstudio-community/Qwen3-30B-A3B-GGUF
Q8_0? 32.48GB
Q6_K? 25.10GB
Q4_K_M 18.63GB
Q3_K_L? 14.58GB

GGUF

Q4_K_M
Ryzen AI Max+ 395 52.89tok/s
Apple M1 Ultra 49tok/s
Apple M1 Max 49tok/s
Snapdragon X Plus 30tok/s

MLX

4bit
Apple M4 Max 87.58 toks/s
Apple M3 Ultra 76.32 toks/s
Apple M2 Ultra 68.51 toks/s
Apple M1 Ultra 60 toks/s
Apple M1 Max 60 toks/s
SoC性能の関係でメモリに載る分を動かすならMLXはM4 Maxの方がM3 Ultraより15%ほど高速
- https://x.com/yasei_no_otoko/status/1917499410432549076
Apple M4 Max 4bit 95tok/s
Apple M4 Max 4bit 100tok/s
https://x.com/akkikiki/status/1917695559063802059
https://x.com/rewse/status/1917582322993619184

関連

MoE

比較対象

QwQ-32B