钛媒体快报 08-30
通义千问推出视觉理解模型Qwen2-VL-72B,API已上线阿里云
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

钛媒体 App 8 月 30 日消息,阿里通义千问发布第二代视觉语言模型 Qwen2-VL,旗舰模型 Qwen2-VL-72B 的 API 已上线阿里云百炼平台。在多个权威测评中,Qwen2-VL 部分指标甚至超越了 GPT-4o 和 Claude3.5-Sonnet 等闭源模型。相比上代模型,Qwen2-VL 可理解 20 分钟以上长视频,支持基于视频的问答、对话和内容创作等应用;可自主操作手机和机器人,借助复杂推理和决策的能力,Qwen2-VL 可以集成到手机、机器人等设备,根据视觉环境和文字指令进行自动操作;能理解图像视频中的多语言文本,包括中文、英文,大多数欧洲语言,日语、韩语、阿拉伯语、越南语等。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

逗玩.AI

逗玩.AI

ZAKER旗下AI智能创作平台

相关标签

阿里云 通义千问 机器人 日语 钛媒体
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论