据 1M AI News 监测,谷歌正式发布开源模型家族 Gemma 4,包含 4 款不同尺寸,全部采用 Apache 2.0 许可证。谷歌表示这是对社区反馈的回应。Apache 2.0 意味着开发者可自由商用、修改和分发,不受额外限制。Hugging Face 联合创始人兼 CEO Clément Delangue 称此举为「巨大的里程碑」。
4 款模型针对不同硬件场景:
1. 31B Dense:原始质量最高,适合微调,未量化权重可在单张 80GB H100 上运行,量化版支持消费级 GPU
2. 26B MoE(混合专家):总参数 26B 但推理时仅激活 3.8B,主打低延迟,适合对速度敏感的 Agent 场景
3. E4B 和 E2B:面向手机和 IoT 设备的边缘模型,推理时分别激活约 4B 和 2B 参数足以保持设备续航,原生支持音频输入(语音识别和理解),可完全离线运行
在大模型匿名对战评测平台 Arena AI 的文本排行榜上,31B 排名全球开源模型第三,26B 排名第六,谷歌称其「超越体量 20 倍的模型」。模型基于与 Gemini 3 相同的研究和技术构建。
核心能力涵盖多步推理与规划、原生函数调用和 JSON 结构化输出(面向 Agent 工作流)、代码生成、图像和视频理解(全系列)、原生训练超过 140 种语言。边缘模型支持 128K 上下文窗口,大模型支持最高 256K。E2B 和 E4B 与谷歌 Pixel 团队、高通和联发科联合优化,可在手机、树莓派、NVIDIA Jetson Orin Nano 等设备上运行,Android 开发者可通过 AICore Developer Preview 原型构建 Agent 应用,为后续 Gemini Nano 4 做兼容准备。
生态方面首日即支持 Hugging Face、vLLM、llama.cpp、MLX、Ollama、NVIDIA NIM、LM Studio、Unsloth 等主流框架,可在 Google AI Studio(31B 和 26B)和 AI Edge Gallery(E4B 和 E2B)直接体验。自初代发布以来,Gemma 系列已被下载超过 4 亿次,社区衍生超过 10 万个变体。