2B开源模型手机养虾！谷歌Gemini 3技术下放：支持语音视频多模态，全免费可商用

31B 开源模型，甩开比他大几十倍的模型，挤进竞技场开源前三。

谷歌刚刚放出的 Gemma 4 有点猛了。

它赢过的是 Qwen3.5-397B 和 DeepSeek v3.2-671B，参数量都比它大了 10-20 倍。

赢过它的是 GLM-5（745B）和 Kimi K2.5（1T），都是 26 年最新旗舰。

31B 做到这个份上，够了。

这次 Gemma 4 整个系列一共四个尺寸，基于 Gemini 3 同款技术打造，全系列支持多模态：

E2B、E4B、26B MoE、31B Dense。

最小的 2B 版手机、树莓派上都能跑，而且跑出来的成绩，也不像是个小模型能干出来的事。

手机不联网，都能跑多模态龙虾处理语音、视频了。

31B 打败 20 倍对手，26B 只激活 3.8B 参数

四个模型，四个定位，但有一个共同点，效率优先。

最大的 31B Dense 模型，作为密集模型，适合拿去做微调。

26B MoE 模型，推理时只激活 3.8B，它排在全球开源第 6，更追求速度，用最少的激活量换取最快的推理。

他它们的硬件门槛也不高。

未量化的 bfloat16 权重，单张 80GB 的 H100 就能跑起来。量化后的版本，普通消费级 GPU 也能本地运行。

根据谷歌官方博客，Gemma 4 家族重点强化了六大核心能力：

高级推理：支持多步规划和深度逻辑，数学和指令遵循基准测试表现大幅提升

Agent 工作流原生支持：内置函数调用、结构化 JSON 输出、系统指令原生支持，能直接搭自主代理

代码生成：支持高质量离线代码生成，直接把工作站变成本地 AI 代码助手

视觉和音频处理：全系列可原生处理视频和图像，支持可变分辨率，OCR、图表理解都不在话下；小版本还支持原生音频输入

长上下文支持：端侧版上下文窗口 128K，大参数版最高 256K，一次性就能读完整段代码仓库

140+ 语言支持：原生在 140 多种语言上训练，做全球化应用不用再单独做本地化

手机离线跑多模态，树莓派也能带得动

再重点说两个专为端侧设计的小模型。

E2B 和 E4B 里的 "E" 是 Effective 的意思，也是走的低激活率 MoE 路子。

E2B 实际上有远多于 2B 的参数量，但推理时只激活其中 2B 的部分。

它们的任务很明确，在手机和 IoT 设备上，原生处理音频和视觉。

意味着手机可以完全不联网，直接用摄像头看东西、用麦克风听声音，然后给你回复。

零延迟，零云端依赖。

谷歌这次还拉上了自家的 Pixel 手机，以及高通、联发科一起做了全链路优化，从芯片到模型到设备，整条链路打通了。

回头看一眼 Gemma 系列进化路线就更清楚这次更新的价值。

Gemma 1 在 2024 年 2 月发布，2B 和 7B 两个尺寸，只能处理纯文本。

Gemma 2 在同年 6 月跟上，2B、9B、27B，依然是纯文本。

Gemma 3 到 2025 年 3 月才开始支持多模态，但端侧的 1B 版本能力有限。

现在 E2B 和 E4B 直接把多模态塞进了端侧小模型，能力边界完全不一样了。

除了多模态，这两个模型还支持完整的智能体工作流。函数调用、结构化 JSON 输出、系统指令。

手机可以变成一个完全本地的 AI 代码助手，耗电养虾，token 自由。

Apache 2.0 协议，社区的呼声被听见

Gemma 4 全面采用 Apache 2.0 协议。

可以概括成三个字：随便用。

过去，Google 开源模型的许可证一直被诟病 " 不够纯粹 "。Gemma 一代和二代用的自定义许可协议，虽然也允许商用，但条款措辞让法务提心吊胆。

这次你可以拿它做商业产品，不需要给 Google 交一分钱。你可以把模型部署在任何环境，公有云、私有机房、边缘设备，都行。

在官方博客里，Google DeepMind 团队写到过去两年，社区反复在 GitHub issue、论坛、社交媒体上喊：

我们要 Apache 2.0。

Google 这次听到了。

Hugging Face 的 CEO 也第一时间表态，他认为这并非一个简单的许可证变更，而是开源 AI 社区的一个分水岭。

Gemma 4 在 Apache 2.0 协议下发布，是一个巨大的里程碑。我们非常激动能在第一天就在 Hugging Face 上支持 Gemma 4 全系列模型。

截至目前，Gemma 系列模型累计下载量超过 4 亿次。社区贡献的模型变体超过 10 万个。

One More Thing

开源模型的价值，不只是让开发者少花钱。

耶鲁大学的研究团队已经用 Gemma 作为基座模型，开发了一个叫 Cell2Sentence-Scale 的项目。

他们把单细胞基因表达数据转化为语言模型的输入序列，让 AI 直接 " 阅读 " 细胞状态。

结果在癌症治疗靶点发现上，找到了几条此前被传统方法忽略的新路径。

没有 Gemma，这个项目可能要花几百万美元买 API 调用。

但现在，一个几十 B 参数的小模型，就推动了真正的科学发现。

下一次你听到 "AI 改变了什么 " 这样的故事，起点可能就是一个开源小模型。

参考链接：

[ 1 ] https://blog.google/innovation-and-ai/technology/developers-tools/gemma-4/?utm_medium=social&utm_content=

[ 2 ] https://x.com/victormustar/status/2039739591276581118?s=20

[ 3 ] https://x.com/billtheinvestor/status/2039805141876871376?s=20

一键三连「点赞」「转发」「小心心」

欢迎在评论区留下你的想法！

— 完 —

风云变幻的 Q1，谁是 AI 超级应用？

量子位智库「AI 100」旗舰、创新双产品榜单开启招募！

扫码申报，让你的产品成为季度风向标。

宙世代

一起剪

相关标签