AGI Hunt

DeepSeek R1 训练方法解析

下午11时 2025/01/21 作者 AGI Hunt

DeepSeek AI 推出 DeepSeek-R1 模型，引入群体相对策略优化（GRPO）和多阶段训练方法。通过强化学习提升大语言模型推理能力，并在监督微调和拒绝采样后形成最终模型。

下午4时 2025/01/21 作者 AGI Hunt

一台超级计算机被塞进了行李箱大小的公文包里。GigaIO和SourceCode联手打造的便携式AI超级计算机Gryf能在任何地方部署AI超算级别的算力，并且拥有模块化设计、强大的散热设计等特点，能支持PB级别数据集处理和现场直接将大量传感器数据转化为可行解决方案。

下午12时 2025/01/21 作者 AGI Hunt

网页抓取终于告别编程时代！Firecrawl推出革命性的/extract功能，只需简单提示词就能将网站转化为结构化数据。它支持批量联系人抓取、数据集构建、信息富集、实时监控等功能，并提供多语言和自动化集成能力。

下午12时 2025/01/21 作者 AGI Hunt

在数学竞赛AIME测试中，Qwen-1.5B模型以28.9%的成绩击败了GPT-4和Claude 3.5-Sonnet。仅1.5B参数量的它，在MATH测试中取得83.9%成绩。DeepSeek团队采用知识蒸馏技术成功将大模型智慧浓缩进更小的模型，MIT许可下开源多个版本。

下午11时 2025/01/20 作者 AGI Hunt

OpenAI新增网站信息显示Operator系统在多项基准测试中表现出色，包括文本编辑和命令行操作，在无辅助模式下达到87.5%准确率，安全上拒绝潜在危险指令98.2%，引发广泛关注。

下午4时 2025/01/20 作者 AGI Hunt

Cursor编辑器与CodeGPT平台合作推出代码库知识图谱功能，直观展示代码库节点关系，支持更丰富的上下文信息，提升开发者效率。

下午4时 2025/01/20 作者 AGI Hunt

OpenAI再次陷入信任危机，被揭发从一开始就可访问FrontierMath全部数据，引发业界哗然。事件揭示了数据使用、透明度及诚信问题，引发了广泛讨论与质疑。

下午12时 2025/01/20 作者 AGI Hunt

OpenAI CEO Sam Altman将在1月30日向美国政府官员汇报即将问世的超级AI代理系统进展情况，该系统能够编写复杂代码、综合分析并全流程管理。多位顶级AI专家发出警告，但也有谨慎声音表示要保持乐观，并呼吁监管层关注AI发展。

下午12时 2025/01/19 作者 AGI Hunt

浙江大学研制的机器狗「黑豹2.0」能在0.1秒内完成从静止到冲刺的转换，速度超越人类运动员。其设计融合了多种动物特征，如跳鼠、黑豹和猎豹。

下午12时 2025/01/19 作者 AGI Hunt

就在TikTok宣布暂停服务之际，Perplexity AI提出收购建议，但估值悬殊引发质疑。特朗普可能给予90天缓冲期，拜登政府静默无言，这一事件被视作针对中国科技企业的政治操作。