上海科技大学归档

SFT+RL双管齐下：ReasonGen-R1如何破解文生图「指令不遵」难题？

2025年6月16日23时作者机器之心

近日提出的一种两阶段训练框架ReasonGen-R1结合监督微调与强化学习提升自回归图像生成模型的推理和创作能力。

简易复现GPT4o转动漫工具

2025年4月4日11时作者路过银河AI

简易工具EasyControl支持一键转换GPT-4o风格，兼容多条件控制和插件功能，已在GitHub上发布预训练模型和Hugging Face演示空间。

SpatialVLA：机器人界的”三维导航仪”！上海AI Lab黑科技实现跨平台秒级控制

2025年3月10日14时作者小兵的AI视界

SpatialVLA模型通过Ego3D位置编码和自适应动作网格等技术提升了机器人在复杂环境中的空间理解能力和操作泛化性能，实现零样本泛化控制、高效适应新场景等功能。

NeurIPS 2024 基于视觉-语言预训练模型的提示词微调理论分析框架

2024年12月30日8时作者 PaperWeekly

本文介绍了上海科技大学 YesAI Lab 在 NeurIPS 2024 发表的工作《Federated Learning from Vision-Language Foundation Models: Theoretical Analysis and Method》。研究针对视觉-语言模型在联邦学习中的提示词微调提出理论分析框架，引入特征动力学理论并设计了PromptFolio机制，在平衡全局与个性化提示词的同时提升性能。

NeurIPS 2024｜打破扩散模型与在线强化学习结合的瓶颈！引入Q变分训练的在线扩散强化学习算法

2024年12月14日8时作者极市干货

该工作提出了一种基于Q变分损失的扩散策略优化方法(QVPO)，解决了扩散模型与在线强化学习结合的问题，提高了样本效率和最终表现。

一	二	三	四	五	六	日
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30	31