资讯
国际
分享
大模型
学术
开源
机器人
关于我们

Banghua Zhu

吴恩达推出LLM 后训练免费课程，覆盖三大调优方法：SFT、DPO、RL

2025年7月10日8时作者 AGI Hunt

吴恩达发布新课程介绍如何将LLM转化为能遵循指令的助手，课程内容涵盖三种后训练方法：监督微调、直接偏好优化与在线强化学习，并强调动手实践的重要性。

分类分享标签 Banghua Zhu、 NexusFlow、华盛顿大学、后训练方法、直接偏好优化、辅助教授发表评论

搜索

AGI AI AI技术 Anthropic ChatGPT Claude DeepSeek DeepSeek-R1 DeepSeek R1 GitHub Google GPT-4o LLM Meta OpenAI Python Sam Altman 人工智能人形机器人具身智能大型语言模型大模型大语言模型字节跳动工业机器人开源强化学习微软扩散模型技术创新智能体木易机器学习深度学习清华大学生成式AI 用户体验百度腾讯自然语言处理英伟达谷歌阿里云阿里巴巴马斯克

分类

分享
国际
大模型
学术
开源
机器人
资讯

登顶全球第一！英伟达市值突破4万亿美元创造历史，AI让老黄身价超1400亿美元，下周访京
基于多智能体AI模型的中文「金融交易决策」开源框架，支持A股、港股、新三板等中国金融市场。
智元机器人回应拟港股IPO：不属实
筹备港股IPO？智元机器人：暂无明确计划
Grok 4刷新ARC-AGI-2纪录：15.9%碾压所有公开模型，我们离AGI还有多远？

2025 年 7 月
一	二	三	四	五	六	日
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30	31

« 6 月

归档

2025 年 7 月
2025 年 6 月
2025 年 5 月
2025 年 4 月
2025 年 3 月
2025 年 2 月
2025 年 1 月
2024 年 12 月
2024 年 11 月

AI新闻 | X平台｜ APK反编译｜京ICP备2024096144号｜

© 2025 每时AI • Built with GeneratePress

下载我们的APP，AI秒送达！立即下载

×