IT之家 10小时前
谷歌把AI大模型能力“压缩”进手机,以后玩游戏全靠“吼”
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

IT 之家 12 月 20 日消息,谷歌于 12 月 18 日发布公告,宣布推出 FunctionGemma,是基于 Gemma 3 270M 微调的专用模型,目的是将强大的函数调用(Function Calling)能力引入手机等边缘设备。

谷歌表示,随着行业从单纯的对话式接口转向主动式智能体(Agent),开发者对模型本地执行任务的需求日益迫切。

FunctionGemma 正是为此而生,它不仅继承了 Gemma 系列的轻量化优势,更通过专项微调,让边缘设备(如智能手机和嵌入式系统)无需依赖云端算力,能够精准理解用户指令并调用相应功能。

与通用大模型不同,FunctionGemma 专为 " 定制化 " 设计。它既能与人类自然对话,也能生成结构化的函数调用代码来指挥计算机。

在 Google 进行的 " 移动操作 "(Mobile Actions)测试中,该模型展现了惊人的可塑性:未经微调的基础版本准确率为 58%,而经过针对性微调后,其执行复杂指令(如 " 明天约午饭并添加到日历 "、" 帮我把昨天拍的美食发给老妈 ")的准确率跃升至 85%。

为了在算力和电池受限的边缘设备上流畅运行,FunctionGemma 采用了极致的轻量化设计。它利用 Gemma 的 256k 词表高效处理 JSON 数据和多语言输入,大幅降低了延迟。

该模型目前已适配 NVIDIA Jetson Nano 等开发板及主流移动设备,甚至能作为 " 交通指挥官 ",处理简单任务并将复杂逻辑路由至更大的 Gemma 3 27B 模型。

为了降低开发门槛,谷歌为 FunctionGemma 构建了广泛的生态支持。开发者现在即可通过 Hugging Face、Kaggle 下载模型,并利用 Unsloth、Keras 或 NVIDIA NeMo 进行微调。

在部署方面,该模型全面支持 LiteRT-LM、vLLM、Llama.cpp 和 Ollama 等工具。谷歌还同步发布了 TinyGarden 游戏演示和 " 移动操作 " 微调指南,展示了如何用自然语言控制虚拟农场或手机系统设置,帮助开发者快速构建属于自己的私有化、低延迟端侧智能体。IT 之家附上演示视频如下:

无论是 " 为明天的午餐创建一个日历事件 "、" 将 John 添加到我的联系人 " 还是 " 打开手电筒 ",该模型都能解析自然语言并识别正确的操作系统工具来执行命令。

在这个互动小游戏中,玩家使用语音指令来管理一块虚拟土地。例如,你可以说 " 在最上面一排种向日葵并浇水 ",模型会将指令分解为具体的应用程序功能,例如针对特定网格坐标的 " 种植作物 " 或 " 浇水作物 "。

使用自然语言解决有趣的物理模拟谜题,款游戏完全在用户浏览器中本地运行,由 FunctionGemma 和 Transformers.js 提供支持。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

谷歌 it之家 轻量化 nvidia 小游戏
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论