框架归档 - 每时AI

扩散LLM推理用上类GRPO强化学习！优于单独SFT，UCLA、Meta新框架d1开源

2025年4月20日16时作者机器之心

扩散模型通过新框架d1实现推理功能，结合监督微调与新颖策略梯度方法diffu-GRPO提升数学和逻辑推理能力。

2025年4月8日16时作者 PaperWeekly

厨房，告诉家中的机器人：“帮我用微波炉热一下碗里的饭。”对人类来说，这似乎再简单不过，但机器人要真正

2025年1月1日8时作者 NLP工程化

一个用于构建和管理LLM应用的平台框架，提供Web界面记录开发和生产期间的所有调用，支持反馈分数、测试用例等功能，适用于多种应用场景。

2024年12月28日10时作者 GitHubStore

Qwen-Agent是一个基于通义千问模型的开发框架，支持开发者通过多种组件快速构建智能体应用，并提供内置GUI支持和示例代码。