杜昕润@M-A-P:SuperGPQA:探索LLMs知识与推理能力的边界
MLNLP社区举办学术Talk邀请杜昕润分享SuperGPQA评估大模型能力,涵盖285个专业领域,覆盖轻工业等未被充分评估的学科。
MLNLP社区举办学术Talk邀请杜昕润分享SuperGPQA评估大模型能力,涵盖285个专业领域,覆盖轻工业等未被充分评估的学科。
滑铁卢大学陈文虎团队提出Mamba-Transformer混合模型Vamba,通过改进模型架构设计提升视频理解效率。相比传统方法,Vamba在同等硬件条件下可处理的视频帧数提升4倍,内存消耗降低50%以上,并实现单步训练速度翻倍。