谷歌基于Gemma 3的一款多模态医疗模型：MedGemma

谷歌基于Gemma 3的一款多模态医疗模型：MedGemma，可以根据医学影像和病历描述生成诊断报告。它在胸部X光片、皮肤病图像、眼科图像、病理切片等大量医疗数据上进行了预训练和微调。

可以看图说话，给一张X光片，让它用文字描述图像内容；让它回答关于医学的问题；或给它一些医学影像和相关病历信息，让它生成一份诊断报告。两个版本：

性能都优于其基础模型，应用场景可以用于医学图像分类；视觉问答，看X光片、看看皮肤照片、看眼底照片、看病理切片；报告生成等等；可做为开发医疗AI应用的起点。

参考文献：
[1] 模型：https://huggingface.co/collections/google/medgemma-release-680aade845f90bec6a3f60c4

知识星球服务内容：Dify源码剖析及答疑，Dify对话系统源码，NLP电子书籍报告下载，公众号所有付费资料。加微信buxingtianxia21进NLP工程化资料群。

（文：NLP工程化）