谷歌Gemma 4正式发布：4款尺寸首次Apache 2.0许可，31B全球开源第三

星期四

04 / 03

星期四 2026-04-03 08:24

据 1M AI News 监测，谷歌正式发布开源模型家族 Gemma 4，包含 4 款不同尺寸，全部采用 Apache 2.0 许可证。谷歌表示这是对社区反馈的回应。Apache 2.0 意味着开发者可自由商用、修改和分发，不受额外限制。Hugging Face 联合创始人兼 CEO Clément Delangue 称此举为「巨大的里程碑」。

4 款模型针对不同硬件场景：

1. 31B Dense：原始质量最高，适合微调，未量化权重可在单张 80GB H100 上运行，量化版支持消费级 GPU
2. 26B MoE（混合专家）：总参数 26B 但推理时仅激活 3.8B，主打低延迟，适合对速度敏感的 Agent 场景
3. E4B 和 E2B：面向手机和 IoT 设备的边缘模型，推理时分别激活约 4B 和 2B 参数足以保持设备续航，原生支持音频输入（语音识别和理解），可完全离线运行

在大模型匿名对战评测平台 Arena AI 的文本排行榜上，31B 排名全球开源模型第三，26B 排名第六，谷歌称其「超越体量 20 倍的模型」。模型基于与 Gemini 3 相同的研究和技术构建。

核心能力涵盖多步推理与规划、原生函数调用和 JSON 结构化输出（面向 Agent 工作流）、代码生成、图像和视频理解（全系列）、原生训练超过 140 种语言。边缘模型支持 128K 上下文窗口，大模型支持最高 256K。E2B 和 E4B 与谷歌 Pixel 团队、高通和联发科联合优化，可在手机、树莓派、NVIDIA Jetson Orin Nano 等设备上运行，Android 开发者可通过 AICore Developer Preview 原型构建 Agent 应用，为后续 Gemini Nano 4 做兼容准备。

生态方面首日即支持 Hugging Face、vLLM、llama.cpp、MLX、Ollama、NVIDIA NIM、LM Studio、Unsloth 等主流框架，可在 Google AI Studio（31B 和 26B）和 AI Edge Gallery（E4B 和 E2B）直接体验。自初代发布以来，Gemma 系列已被下载超过 4 亿次，社区衍生超过 10 万个变体。