ノートPC · Apple Silicon

オープンモデル対決 — Qwen 3.5 vs Gemma 4

お使いのハードウェアでは、Gemma 4 31BGemma 4 26B-A4B が快適に動作する最高性能モデルです。Qwen3.5-122B-A10B が収まる最大モデルで、ツールコール最強。大型モデル(Kimi、GLM-5、DeepSeek)は一部カテゴリでリード——ただし大半の環境では API のみ。

14 モデル数
7 ファミリー
18 ベンチマーク
5 GB–500 GB Q4 範囲
あなたの RAM:

ベンチマークスコア

各モデルに Q4 サイズと選択した RAM に対するフィット指標を表示。各ベンチマークの最高スコアは金色で表示。

推論と知識

モデルMMLU-ProGPQA DiamondBigBench-EHIFBench
GLM-5~370GB Q487.186
Qwen3.5-27B~15GB Q486.185.5
Gemma 4 31B~20GB Q485.284.374.4
Gemma 4 26B-A4B~18GB Q482.682.364.8
Qwen3.5-9B~5.1GB Q482.581.7
GPT-oss 120B~60GB Q480.880.1
Qwen3.5-397B-A17B~199GB Q488.476.5
Kimi K2.5~500GB Q487.694
DeepSeek V3.2~340GB Q479.9

数学

モデルAIME 2025/2026MATH-500HMMT Feb 2025
Kimi K2.5~500GB Q496.1(AIME 2025)98
GLM-5~370GB Q495.7(AIME 2025)
Qwen3.5-397B-A17B~199GB Q491.3(AIME 2026)
DeepSeek V3.2~340GB Q489.3(AIME 2025)
Gemma 4 31B~20GB Q489.2(AIME 2026)
Gemma 4 26B-A4B~18GB Q488.3(AIME 2026)
Gemma 4 E4B~5GB Q442.5(AIME 2026)
Qwen3.5-9B~5.1GB Q483.2

コーディング

モデルLiveCodeBench v6SWE-benchHumanEvalCodeforces ELOTerminal-Bench 2.0
MiMo-V2-Flash~155GB Q48773.4
Kimi K2.5~500GB Q48576.899
Qwen3.5-397B-A17B~199GB Q483.676.452.5
Qwen3.5-9B~5.1GB Q482.7
Gemma 4 31B~20GB Q4802150
Gemma 4 26B-A4B~18GB Q477.11718
GLM-5~370GB Q45277.8

ビジョン / マルチモーダル

モデルMMMUMMMU-ProMathVisionOmniDocBench
Qwen3.5-397B-A17B~199GB Q48588.690.8
Gemma 4 31B~20GB Q476.985.6
Gemma 4 26B-A4B~18GB Q473.882.4
Qwen3.5-9B~5.1GB Q470.1

エージェント

モデルTau2-BenchBrowseCompBFCL-V4 (Tool Use)
Qwen3.5-397B-A17B~199GB Q486.778.6
Qwen3.5-122B-A10B~65GB Q472.2
ベンチマークバージョンの注意: Qwen 3.5 と Gemma 4 は AIME 2026 / LiveCodeBench v6 で報告。Kimi K2.5、GLM、DeepSeek は AIME 2025 / 旧版で報告が多い。ファミリー間の比較は参考程度に。

128 GB のハードウェアでは、Qwen3.5-122B-A10B が収まる最高性能モデルです(~65 GB Q4)。 Kimi K2.5, Qwen3.5-397B-A17B, MiMo-V2-Flash は一部カテゴリでリードしていますが、128 GB では API のみです。

マルチエージェント構成:Qwen3.5-27B + Gemma 4 31B + Qwen3.5-9B = ~40 GB。残り 88 GB を KV キャッシュと OS に。 最高性能を求めるなら:Kimi K2.5, Qwen3.5-397B-A17B, MiMo-V2-Flash(API 経由)。

ベンチマークデータは 2026 年 4 月に公式モデル論文、Artificial Analysis、LMSYS Arena から収集。Qwen 3.5 と Gemma 4 は AIME 2026 / LiveCodeBench v6 で報告。Kimi K2.5、GLM、DeepSeek は AIME 2025 / 旧版で報告。ファミリー間比較は参考程度。