多模态竞技场对标90B Llama 3.2!Pixtral 12B技术报告全公开
Mistral AI发布了自家首个多模态大模型Pixtral 12B,并详细介绍了其技术细节。Pixtral采用全新的视觉编码器,支持不同分辨率和纵横比的图像输入,性能优于多个开源模型和闭源模型,在多种实际场景下的评估中表现出色。
news
Mistral AI发布了自家首个多模态大模型Pixtral 12B,并详细介绍了其技术细节。Pixtral采用全新的视觉编码器,支持不同分辨率和纵横比的图像输入,性能优于多个开源模型和闭源模型,在多种实际场景下的评估中表现出色。
Mistral AI 发布了Pixtral Large超大杯多模态模型,具备强大的图像理解能力,并升级了免费聊天机器人le Chat,新增图像生成、网络搜索和交互式画布功能。
阿里推出Qwen 2.5-Turbo模型,支持百万token上下文处理,速度提升4.3倍至68秒输出首个token,价格降低,性能超越同类产品,在长文本理解和细节捕捉方面表现出色。