1 月 27 日,DeepSeek 团队发布全新 DeepSeek-OCR 2 模型并开源,采用创新的 DeepEncoder V2 方法,让 AI 能够根据图像的含义动态重排图像的各个部分,而不再只是机械地从左到右扫描。这种方式更接近人类的视觉编码逻辑。最终,该模型在处理布局复杂的图片时,表现优于传统的视觉 - 语言模型,实现了更智能、更具因果推理能力的视觉理解。

编辑|程鹏 杜波
校对|许绍航
封面图片来源:视觉中国(资料图)
每日经济新闻综合自每经 AI 快讯
每日经济新闻

1 月 27 日,DeepSeek 团队发布全新 DeepSeek-OCR 2 模型并开源,采用创新的 DeepEncoder V2 方法,让 AI 能够根据图像的含义动态重排图像的各个部分,而不再只是机械地从左到右扫描。这种方式更接近人类的视觉编码逻辑。最终,该模型在处理布局复杂的图片时,表现优于传统的视觉 - 语言模型,实现了更智能、更具因果推理能力的视觉理解。
编辑|程鹏 杜波
校对|许绍航
封面图片来源:视觉中国(资料图)
每日经济新闻综合自每经 AI 快讯
每日经济新闻
登录后才可以发布评论哦
打开小程序可以发布评论哦