DeepSeek-VL2 开源：AI视觉模型迈入 MoE 时代-科技今日热点

IT之家12月14日消息，DeepSeek官方公众号昨日（12月13日）发布博文，宣布开源DeepSeek-VL2模型，在各项评测指标上均取得了极具优势的成绩，官方称其视觉模型正式迈入混合专家模型（MixtureofExperts，简称MoE）时代。

IT之家援引官方新闻稿，附上DeepSeek-VL2亮点如下：

数据：比一代DeepSeek-VL多一倍优质训练数据，引入梗图理解、视觉定位、视觉故事生成等新能力

架构：视觉部分使用切图策略支持动态分辨率图像，语言部分采用MoE架构低成本高性能

训练：继承DeepSeek-VL的三阶段训练流程，同时通过负载均衡适配图像切片数量不定的困难，对图像和文本数据使用不同流水并行策略，对MoE语言模型引入专家并行，实现高效训练

DeepSeek-VL2模型支持动态分辨率，仅使用一个SigLIP-SO400M作为图像编码器，通过将图像切分为多张子图和一张全局缩略图来实现动态分辨率图像支持。这一策略让DeepSeek-VL2最多支持1152x1152的分辨率和1:9或9:1的极端长宽比，适配更多应用场景。

DeepSeek-VL2模型还得益于更多科研文档数据的学习，可以轻松理解各种科研图表，并通过Plot2Code，根据图像生成Python代码。

模型和论文均已发布：

模型下载：https://huggingface.co/deepseek-ai

GitHub主页：https://github.com/deepseek-ai/DeepSeek-VL2

	川渝两地青少年携手“飞上蓝天”，共逐低空梦想
	雷霆四喜临门：SGA32+5断再刷纪录保底20万美元五连胜稳西区霸主
	中央经济工作会议深读｜专访贾康：推出超常规安排，政策加码框架清晰
	吃完橘子这2种食物尽量少碰，或致甲状腺结节
	早餐不能吃“小米粥”？医生：不止小米粥，6种早餐，请撤下餐桌
	一半糖尿病患者可能出现黎明现象，清晨高血糖原因如何？带您了解
	中老年人少吃米饭馒头，用这3种代替主食，营养饱腹还健康
	改变饮食习惯，延长寿命！低热量饮食成关键
	吃对食物，瘦下来其实很简单！20种减肥食物推荐，你必须知道
	4人死亡！废弃小学爆燃事故调查报告公布

头条资讯网_今日热点_娱乐才是你关心的时事