医疗大模型开放评测平台MedBench升级至3.0版本

医疗大模型开放评测平台MedBench升级至3.0版本，新增医疗多模态评测能力，针对真实应用场景，构建了文献问答、复杂推理、临床危急情况识别评测数据集，并继续向业界开放医疗大模型能力评测服务。

参考文献：
[1] 司南MedBench3.0全面上新，4200次评测揭示医疗大模型能力长项与核心短板：https://mp.weixin.qq.com/s/KBqkLjH8fjCpb8n8gcl-KA

[2] Benchmarking Chinese Medical LLMs: A Medbench-based Analysis of Performance Gaps and Hierarchical Optimization Strategies：https://arxiv.org/abs/2503.07306

（文：NLP工程化）

欢迎分享

一	二	三	四	五	六	日
					1	2
3	4	5	6	7	8	9
10	11	12	13	14	15	16
17	18	19	20	21	22	23
24	25	26	27	28	29	30
31

发表评论 取消回复

发表评论取消回复