资讯
国际
分享
大模型
学术
开源
机器人
关于我们

joey00072

nanoGRPO：一个轻量的GRPO实现

2025年3月9日8时作者 NLP工程化

nanoGRPO：一个轻量的Group Relative Policy Optimization (GRPO) 实现，仅需8GB显存即可运行，显著提升语言模型表现。

分类开源标签 8GB 显存、 Group Relative Policy Optimization (GRPO)、 joey00072、未知、轻量、高效发表评论

搜索

2025年 AGI AI AI技术 Anthropic ChatGPT Claude DeepSeek DeepSeek-R1 DeepSeek R1 GitHub GPT-4o LLM Meta OpenAI Python Sam Altman 人工智能人形机器人具身智能大型语言模型大模型大语言模型字节跳动工业机器人开源强化学习微软扩散模型技术创新智能体木易机器学习深度学习清华大学生成式AI 用户体验百度腾讯自然语言处理英伟达谷歌阿里云阿里巴巴马斯克

分类

分享
国际
大模型
学术
开源
机器人
资讯

万事俱备不缺东风，宇树科技站在科创板与港交所门口
不死的程序员
开源4小时斩获1.8k星星！用AI记录电脑的全部画面和声音，支持会议纪要。
不学美国砸钱烧AI，欧洲科技巨头另辟蹊径！
xAI美国数据中心获批使用天然气发电

2025 年 7 月
一	二	三	四	五	六	日
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30	31

« 6 月

归档

2025 年 7 月
2025 年 6 月
2025 年 5 月
2025 年 4 月
2025 年 3 月
2025 年 2 月
2025 年 1 月
2024 年 12 月
2024 年 11 月

AI新闻 | X平台｜ APK反编译｜京ICP备2024096144号｜

© 2025 每时AI • Built with GeneratePress

下载我们的APP，AI秒送达！立即下载

×