谷歌Gemma 4正式发布:4款尺寸首次Apache 2.0许可,31B全球开源第三

快链头条 2026-04-03 08:24:55
阅读 3,679
二维码
微信扫一扫,分享此文章

据 1M AI News 监测,谷歌正式发布开源模型家族 Gemma 4,包含 4 款不同尺寸,全部采用 Apache 2.0 许可证。谷歌表示这是对社区反馈的回应。Apache 2.0 意味着开发者可自由商用、修改和分发,不受额外限制。Hugging Face 联合创始人兼 CEO Clément Delangue 称此举为「巨大的里程碑」。

4 款模型针对不同硬件场景:

1. 31B Dense:原始质量最高,适合微调,未量化权重可在单张 80GB H100 上运行,量化版支持消费级 GPU
2. 26B MoE(混合专家):总参数 26B 但推理时仅激活 3.8B,主打低延迟,适合对速度敏感的 Agent 场景
3. E4B 和 E2B:面向手机和 IoT 设备的边缘模型,推理时分别激活约 4B 和 2B 参数足以保持设备续航,原生支持音频输入(语音识别和理解),可完全离线运行

在大模型匿名对战评测平台 Arena AI 的文本排行榜上,31B 排名全球开源模型第三,26B 排名第六,谷歌称其「超越体量 20 倍的模型」。模型基于与 Gemini 3 相同的研究和技术构建。

核心能力涵盖多步推理与规划、原生函数调用和 JSON 结构化输出(面向 Agent 工作流)、代码生成、图像和视频理解(全系列)、原生训练超过 140 种语言。边缘模型支持 128K 上下文窗口,大模型支持最高 256K。E2B 和 E4B 与谷歌 Pixel 团队、高通和联发科联合优化,可在手机、树莓派、NVIDIA Jetson Orin Nano 等设备上运行,Android 开发者可通过 AICore Developer Preview 原型构建 Agent 应用,为后续 Gemini Nano 4 做兼容准备。

生态方面首日即支持 Hugging Face、vLLM、llama.cpp、MLX、Ollama、NVIDIA NIM、LM Studio、Unsloth 等主流框架,可在 Google AI Studio(31B 和 26B)和 AI Edge Gallery(E4B 和 E2B)直接体验。自初代发布以来,Gemma 系列已被下载超过 4 亿次,社区衍生超过 10 万个变体。

快链头条登载此文本着传递更多信息的缘由,并不代表赞同其观点或证实其描述。
文章内容仅供参考,不构成投资建议。投资者据此操作,风险自担。
投资有风险,入市须谨慎。本资讯不作为投资理财建议。

推荐活动
风险提示
根据银保监会等五部门于 2018 年 8月发布《关于防范以「虚拟货币」「区块链」名义进行非法集资的风险提示》的文件, 请广大公众理性看待区块链,不要盲目相信天花乱坠的承诺,树立正确的货币观念和投资理念,切实提高风险意识;对发现的违法犯罪线索,可积极向有关部门举报反映。