何恺明MIT开门弟子名单公开:奥赛双料金牌得主、清华姚班学霸在列
何恺明团队入驻MIT后公布的研究成果包括使用连续标记的Fluid模型刷新FID和GenEval分数的文本到图像生成,以及跨不同机器人的异构预训练架构HPT。博士生邓明扬在竞赛中表现出色,黎天鸿负责表示学习和生成模型研究,并担任ICLR 2025区域主席。团队还包括白行健和Jake Austin等成员。
何恺明团队入驻MIT后公布的研究成果包括使用连续标记的Fluid模型刷新FID和GenEval分数的文本到图像生成,以及跨不同机器人的异构预训练架构HPT。博士生邓明扬在竞赛中表现出色,黎天鸿负责表示学习和生成模型研究,并担任ICLR 2025区域主席。团队还包括白行健和Jake Austin等成员。
OmniControl 是一个最小但功能强大的通用控制框架,通过提供素材图生成图片,融合效果一般。它支持主题驱动控制和空间控制等特性,并且提供了快速开始指南及示例使用方法。
Luma AI 发布的视频模型Dream Machine支持图文结合生成视频,并且提供风格参考和角色参考等功能,让创作过程更加直观和可控。
使用国产大模型豆包进行图像编辑时意外发现新功能——通过语音指令实现‘用嘴改图’,无需涂抹区域。该功能可直接上传图片并根据提示快速生成修改后的版本。
mistral.ai发布了124B参数的Pixtral Large多模态模型及AI助手le Chat,支持网页搜索、Canvas编辑、文档理解等能力,并在数学推理任务上超过其他模型。