谷歌基于Gemma 3的一款多模态医疗模型:MedGemma

谷歌基于Gemma 3的一款多模态医疗模型:MedGemma,可以根据医学影像和病历描述生成诊断报告。它在胸部X光片、皮肤病图像、眼科图像、病理切片等大量医疗数据上进行了预训练和微调。

可以看图说话,给一张X光片,让它用文字描述图像内容;让它回答关于医学的问题;或给它一些医学影像和相关病历信息,让它生成一份诊断报告。两个版本:

  • 4B 多模态版,支持图像和文本
  • 27B 纯文本版

性能都优于其基础模型,应用场景可以用于医学图像分类;视觉问答,看X光片、看看皮肤照片、看眼底照片、看病理切片;报告生成等等;可做为开发医疗AI应用的起点。

参考文献:
[1] 模型:https://huggingface.co/collections/google/medgemma-release-680aade845f90bec6a3f60c4



知识星球服务内容:Dify源码剖析及答疑,Dify对话系统源码,NLP电子书籍报告下载,公众号所有付费资料。加微信buxingtianxia21进NLP工程化资料群

(文:NLP工程化)

发表评论

×

下载每时AI手机APP

 

和大家一起交流AI最新资讯!

立即前往