GPT-4o医学知识覆盖率仅55%?腾讯优图团队发布大模型医疗能力“体检报告”
腾讯优图实验室提出MedKGEval框架,首次通过医疗知识图谱评估主流大语言模型的医学知识覆盖度,并在WWW 2025会议上发布。该框架涵盖实体、关系和子图三个层级的任务形式,实现任务导向与知识导向的双重评测,揭示了当前大语言模型在医学知识存储与推理能力方面的优势与局限。
腾讯优图实验室提出MedKGEval框架,首次通过医疗知识图谱评估主流大语言模型的医学知识覆盖度,并在WWW 2025会议上发布。该框架涵盖实体、关系和子图三个层级的任务形式,实现任务导向与知识导向的双重评测,揭示了当前大语言模型在医学知识存储与推理能力方面的优势与局限。
复旦大学、腾讯优图实验室等机构的研究人员提出UniCombine框架,能够处理多种条件组合的多条件可控生成任务,并在多个实验中达到SOTA。
复旦大学和腾讯优图实验室提出PixelPonder,一种新的多视觉控制框架。它解决了当前方法在组合多个异构控制信号时面临的挑战,显著提高图像生成的可控性和文本一致性。