31B 开源模型,甩开比他大几十倍的模型,挤进竞技场开源前三。
谷歌刚刚放出的 Gemma 4 有点猛了。

它赢过的是 Qwen3.5-397B 和 DeepSeek v3.2-671B,参数量都比它大了 10-20 倍。
赢过它的是 GLM-5(745B)和 Kimi K2.5(1T),都是 26 年最新旗舰。
31B 做到这个份上,够了。

这次 Gemma 4 整个系列一共四个尺寸,基于 Gemini 3 同款技术打造,全系列支持多模态:
E2B、E4B、26B MoE、31B Dense。
最小的 2B 版手机、树莓派上都能跑,而且跑出来的成绩,也不像是个小模型能干出来的事。
手机不联网,都能跑多模态龙虾处理语音、视频了。
31B 打败 20 倍对手,26B 只激活 3.8B 参数
四个模型,四个定位,但有一个共同点,效率优先。
最大的 31B Dense 模型,作为密集模型,适合拿去做微调。
26B MoE 模型,推理时只激活 3.8B,它排在全球开源第 6,更追求速度,用最少的激活量换取最快的推理。
他它们的硬件门槛也不高。
未量化的 bfloat16 权重,单张 80GB 的 H100 就能跑起来。量化后的版本,普通消费级 GPU 也能本地运行。

根据谷歌官方博客,Gemma 4 家族重点强化了六大核心能力:
高级推理:支持多步规划和深度逻辑,数学和指令遵循基准测试表现大幅提升
Agent 工作流原生支持:内置函数调用、结构化 JSON 输出、系统指令原生支持,能直接搭自主代理
代码生成:支持高质量离线代码生成,直接把工作站变成本地 AI 代码助手
视觉和音频处理:全系列可原生处理视频和图像,支持可变分辨率,OCR、图表理解都不在话下;小版本还支持原生音频输入
长上下文支持:端侧版上下文窗口 128K,大参数版最高 256K,一次性就能读完整段代码仓库
140+ 语言支持:原生在 140 多种语言上训练,做全球化应用不用再单独做本地化
手机离线跑多模态,树莓派也能带得动
再重点说两个专为端侧设计的小模型。
E2B 和 E4B 里的 "E" 是 Effective 的意思,也是走的低激活率 MoE 路子。
E2B 实际上有远多于 2B 的参数量,但推理时只激活其中 2B 的部分。
它们的任务很明确,在手机和 IoT 设备上,原生处理音频和视觉。
意味着手机可以完全不联网,直接用摄像头看东西、用麦克风听声音,然后给你回复。
零延迟,零云端依赖。
谷歌这次还拉上了自家的 Pixel 手机,以及高通、联发科一起做了全链路优化,从芯片到模型到设备,整条链路打通了。
回头看一眼 Gemma 系列进化路线就更清楚这次更新的价值。
Gemma 1 在 2024 年 2 月发布,2B 和 7B 两个尺寸,只能处理纯文本。
Gemma 2 在同年 6 月跟上,2B、9B、27B,依然是纯文本。
Gemma 3 到 2025 年 3 月才开始支持多模态,但端侧的 1B 版本能力有限。
现在 E2B 和 E4B 直接把多模态塞进了端侧小模型,能力边界完全不一样了。
除了多模态,这两个模型还支持完整的智能体工作流。函数调用、结构化 JSON 输出、系统指令。
手机可以变成一个完全本地的 AI 代码助手,耗电养虾,token 自由。
Apache 2.0 协议,社区的呼声被听见
Gemma 4 全面采用 Apache 2.0 协议。
可以概括成三个字:随便用。
过去,Google 开源模型的许可证一直被诟病 " 不够纯粹 "。Gemma 一代和二代用的自定义许可协议,虽然也允许商用,但条款措辞让法务提心吊胆。
这次你可以拿它做商业产品,不需要给 Google 交一分钱。你可以把模型部署在任何环境,公有云、私有机房、边缘设备,都行。
在官方博客里,Google DeepMind 团队写到过去两年,社区反复在 GitHub issue、论坛、社交媒体上喊:
我们要 Apache 2.0。
Google 这次听到了。
Hugging Face 的 CEO 也第一时间表态,他认为这并非一个简单的许可证变更,而是开源 AI 社区的一个分水岭。
Gemma 4 在 Apache 2.0 协议下发布,是一个巨大的里程碑。我们非常激动能在第一天就在 Hugging Face 上支持 Gemma 4 全系列模型。

截至目前,Gemma 系列模型累计下载量超过 4 亿次。社区贡献的模型变体超过 10 万个。
One More Thing
开源模型的价值,不只是让开发者少花钱。
耶鲁大学的研究团队已经用 Gemma 作为基座模型,开发了一个叫 Cell2Sentence-Scale 的项目。
他们把单细胞基因表达数据转化为语言模型的输入序列,让 AI 直接 " 阅读 " 细胞状态。
结果在癌症治疗靶点发现上,找到了几条此前被传统方法忽略的新路径。

没有 Gemma,这个项目可能要花几百万美元买 API 调用。
但现在,一个几十 B 参数的小模型,就推动了真正的科学发现。
下一次你听到 "AI 改变了什么 " 这样的故事,起点可能就是一个开源小模型。
参考链接:
[ 1 ] https://blog.google/innovation-and-ai/technology/developers-tools/gemma-4/?utm_medium=social&utm_content=
[ 2 ] https://x.com/victormustar/status/2039739591276581118?s=20
[ 3 ] https://x.com/billtheinvestor/status/2039805141876871376?s=20
一键三连「点赞」「转发」「小心心」
欢迎在评论区留下你的想法!
— 完 —
风云变幻的 Q1,谁是 AI 超级应用?
量子位智库「AI 100」旗舰、创新双产品榜单开启招募!
扫码申报,让你的产品成为季度风向标。



登录后才可以发布评论哦
打开小程序可以发布评论哦