36 氪获悉,12 月 12 日,在 2025 全球开发者先锋大会上,联汇科技正式发布 VLM-FO1、OpenTrackVLA 两项核心开源成果,并携 OmAgent 开发者社区首次线下亮相。据了解,VLM-FO1 作为即插即用的视觉 - 语言模型(VLM)增强框架,支持复杂视觉推理、开放词汇目标检测、视频对象跟踪等多元任务。OpenTrackVLA 为完全开源的视觉 - 语言 - 动作(VLA)系统 ,可实现自然语言指令、实时视觉感知与机器人动作规划的深度融合。

36 氪获悉,12 月 12 日,在 2025 全球开发者先锋大会上,联汇科技正式发布 VLM-FO1、OpenTrackVLA 两项核心开源成果,并携 OmAgent 开发者社区首次线下亮相。据了解,VLM-FO1 作为即插即用的视觉 - 语言模型(VLM)增强框架,支持复杂视觉推理、开放词汇目标检测、视频对象跟踪等多元任务。OpenTrackVLA 为完全开源的视觉 - 语言 - 动作(VLA)系统 ,可实现自然语言指令、实时视觉感知与机器人动作规划的深度融合。
登录后才可以发布评论哦
打开小程序可以发布评论哦