o1-mini归档 - 每时AI

OpenAI强化微调终于上线了：几十个样本就可轻松打造AI专家

下午4时 2025/05/09 作者 AI寒武纪

OpenAI正式推出强化微调（RFT），通过思维链推理和任务专属评分机制提升模型特定领域的性能。目前已开放给经过验证的组织使用，并提供折扣优惠和指南。RFT适用于需要正确且可验证决策的工作流，已在芯片设计、医疗编码分配及税务分析等多个领域展示出色效果。

下午4时 2025/03/04 作者新智元

能力就开始暴涨。更令人吃惊是，Qwen2.5-14B居然给出了此前从未见过的希尔伯特问题的反例！而人

下午4时 2024/12/31 作者量子位

国产模型DeepSeek V3在竞技场中表现优异，但在部分逻辑陷阱问题上略逊一筹。量子位进行了实测对比，发现Claude 3.5 Sonnet在理解某些脑筋急转弯和弱智吧问题上更为精准。