大瓜来了!Llama 4 陷刷榜争议:“内部员工”发帖控诉,测评版本被指特供?
一篇来自‘一亩三分地’论坛的帖子爆料称Meta的新大模型Llama 4训练效果未达开源SOTA基准,公司采取混入测试集数据以满足目标的做法引发争议。此外,TechCrunch质疑Meta在LM Arena排行榜上提交的版本可能与公开版不同,并认为这种行为可能误导开发者。
一篇来自‘一亩三分地’论坛的帖子爆料称Meta的新大模型Llama 4训练效果未达开源SOTA基准,公司采取混入测试集数据以满足目标的做法引发争议。此外,TechCrunch质疑Meta在LM Arena排行榜上提交的版本可能与公开版不同,并认为这种行为可能误导开发者。
本文由加拿大滑铁卢大学魏聪、陈文虎教授团队与 Meta GenAI 共同完成,首次提出面向Talking Characters任务的视频生成方法MoCha,实现仅基于语音和文本输入生成完整角色对话视频。
今日介绍请清明假期大模型进展,涵盖Llama4开源评测及吉卜力风格图像生成模型EasyControl_Ghibli,指出中文支持效果不佳,建议谨慎使用。同时总结了多模态微调与继续预训练讨论,并推荐相关技术文章阅读。
Meta发布Llama 4系列,强调多模态和超长上下文窗口;OpenAI确认O3和O4-mini即将上线且GPT-5将免费;DeepSeek与清华提出SPCT方法提升推理扩展性能。
近期开源的OpenVLA模型通过高效的参数利用和卓越性能推动了机器人技术的发展。基于Llama 2语言模型和融合视觉编码器,它能够将自然语言指令转化为精确的机器人动作。支持在消费级GPU上进行微调,并实现高效服务。应用场景包括家庭服务机器人、工业机器人及教育研究等领域。