DeepSeek开源o1击毙OpenAI,强化学习惊现「啊哈」时刻!网友:AGI来了 下午4时 2025/01/21 作者 新智元 中国版o1 DeepSeek R1通过大规模强化学习训练,在多项任务中与OpenAI o1打成平手,展示了不依赖监督微调数据也能显著提升推理能力的潜力。
什么是AI Agent,以及怎么实现AI Agent? 上午11时 2024/12/03 作者 AI探索时代 AI Agent是让大模型能够与现实世界接触的方法,它结合函数调用、记忆和推理规划能力来完成复杂任务。