Predibase归档 - 每时AI

比DeepSeek、o1高3倍！首创无服务器强化微调，只需十几个数据点，

2025-03-20 作者 AIGC开放社区

专注AIGC领域的专业社区报道了Predibase发布的首个端到端强化学习微调（RFT）平台，该平台使用奖励函数和自定义函数加速大模型训练，并展示了其在代码翻译任务上的成功案例。

2025-03-04 作者 Z Potentials

DeepSeek-R1的到来标志着AI开源模型与专有模型竞争的新转折点。它在关键推理基准测试中与OpenAI最新模型持平，增强了强化学习能力，并开启了新的应用领域和成本效益更高的部署前景。

2025-02-08 作者 Z Potentials

DeepSeek-R1 的推出标志着开源模型与闭源模型之间的竞争平衡，同时提升了AI基础设施的质量和易用性。它在推理能力方面表现出色，并开启了新的应用领域，如自主AI代理、专业规划系统以及优化的企业人工智能助手等。