IT之家9月12日消息,科技媒体TechCrunch昨日(9月11日)报道,法国AI初创公司Mistral发布Pixtral12B,是该公司首款能够同时处理图像和文本的多模态AI大语音模型。
Pixtral12B模型拥有120亿参数,大小约为24GB,参数大致对应于模型的解题能力,拥有更多参数的模型通常比参数较少的模型表现更优。
Pixtral12B模型基于文本模型Nemo12B构建,能够回答关于任意数量、任意尺寸图像的问题。
与Anthropic的Claude系列和OpenAI的GPT-4o等其他多模态模型类似,Pixtral12B理论上应能执行诸如为图像添加描述和统计照片中物体数量等任务。
用户可以下载、微调Pixtral12B模型,并能依据Apache2.0许可证使用。
Mistral开发者关系负责人SophiaYang在X平台的一篇帖子中表示,Pixtral12B很快将在Mistral的聊天机器人和API服务平台LeChat及LePlateforme上开放测试。
IT之家附上相关跑分情况如下:
参考
未经允许不得转载:头条资讯网_今日热点_娱乐才是你关心的时事 » Pixtral 12B 发布:Mistral 首款多模态 AI 大模型