手提電腦 · Apple Silicon

開源模型大比拼 — Qwen 3.5 vs Gemma 4

喺你嘅硬件上,Gemma 4 31BGemma 4 26B-A4B 係放得落嘅最強模型。Qwen3.5-122B-A10B 係放得落嘅最大模型,而且 tool-calling 最強。巨型模型(Kimi、GLM-5、DeepSeek)喺部分項目領先——但大部分配置只能用 API。

14 模型數
7 家族
18 測試項目
5 GB–500 GB Q4 範圍
你嘅 RAM:

跑分成績

每個模型標示 Q4 大小同你嘅 RAM 容量指標。每項跑分最高分以金色標示。

推理同知識

模型MMLU-ProGPQA DiamondBigBench-EHIFBench
GLM-5~370GB Q487.186
Qwen3.5-27B~15GB Q486.185.5
Gemma 4 31B~20GB Q485.284.374.4
Gemma 4 26B-A4B~18GB Q482.682.364.8
Qwen3.5-9B~5.1GB Q482.581.7
GPT-oss 120B~60GB Q480.880.1
Qwen3.5-397B-A17B~199GB Q488.476.5
Kimi K2.5~500GB Q487.694
DeepSeek V3.2~340GB Q479.9

數學

模型AIME 2025/2026MATH-500HMMT Feb 2025
Kimi K2.5~500GB Q496.1(AIME 2025)98
GLM-5~370GB Q495.7(AIME 2025)
Qwen3.5-397B-A17B~199GB Q491.3(AIME 2026)
DeepSeek V3.2~340GB Q489.3(AIME 2025)
Gemma 4 31B~20GB Q489.2(AIME 2026)
Gemma 4 26B-A4B~18GB Q488.3(AIME 2026)
Gemma 4 E4B~5GB Q442.5(AIME 2026)
Qwen3.5-9B~5.1GB Q483.2

寫 Code

模型LiveCodeBench v6SWE-benchHumanEvalCodeforces ELOTerminal-Bench 2.0
MiMo-V2-Flash~155GB Q48773.4
Kimi K2.5~500GB Q48576.899
Qwen3.5-397B-A17B~199GB Q483.676.452.5
Qwen3.5-9B~5.1GB Q482.7
Gemma 4 31B~20GB Q4802150
Gemma 4 26B-A4B~18GB Q477.11718
GLM-5~370GB Q45277.8

視覺 / 多模態

模型MMMUMMMU-ProMathVisionOmniDocBench
Qwen3.5-397B-A17B~199GB Q48588.690.8
Gemma 4 31B~20GB Q476.985.6
Gemma 4 26B-A4B~18GB Q473.882.4
Qwen3.5-9B~5.1GB Q470.1

代理能力

模型Tau2-BenchBrowseCompBFCL-V4 (Tool Use)
Qwen3.5-397B-A17B~199GB Q486.778.6
Qwen3.5-122B-A10B~65GB Q472.2
跑分版本提醒: Qwen 3.5 同 Gemma 4 用 AIME 2026 / LiveCodeBench v6。Kimi K2.5、GLM、DeepSeek 多數用 AIME 2025 / 舊版本。跨家族比較只係參考。

喺你嘅 128 GB 硬件上,Qwen3.5-122B-A10B 係放得落嘅最強模型(~65 GB Q4)。 Kimi K2.5, Qwen3.5-397B-A17B, MiMo-V2-Flash 喺部分項目領先,但喺 128 GB 下只能用 API。

多模型組合:Qwen3.5-27B + Gemma 4 31B + Qwen3.5-9B = ~40 GB。剩返 88 GB 畀 KV caches 同 OS。 追求極限效能:Kimi K2.5, Qwen3.5-397B-A17B, MiMo-V2-Flash,透過 API。

跑分數據喺 2026 年 4 月彙整自官方模型論文、Artificial Analysis 同 LMSYS Arena。Qwen 3.5 同 Gemma 4 用 AIME 2026 / LiveCodeBench v6。Kimi K2.5、GLM、DeepSeek 用 AIME 2025 / 舊版本。跨家族比較只係參考。