「不思考」反而更强?上海AI Lab重新定义视觉强化学习微调最优路径 下午4时 2025/05/08 作者 PaperWeekly 且在一些模型上取得了优于监督微调(SFT)的成果。 RFT 利用可验证的奖励进行训练,鼓励模型在回答
解密英伟达芯片架构命名:科学巨匠的数字重生 上午11时 2025/05/05 作者 HyperAI超神经 代产品的命名都映射着历史上杰出科学家的光芒。这些名字究竟有着怎样的故事?它们背后凝聚着哪些人类科学智
18 岁亿万富豪遭名校集体拒收!高中靠 AI 狂揽 300 万用户,入学申请竟成“炫富”翻车现场? 下午4时 2025/04/08 作者 AI前线 ari 在社交平台上透露,自己拥有 4.0 的平均绩点(GPA)和 34 分的美国大学入学考试(AC
海尔智家与星动纪元达成战略合作,将共推“小蛮腰”家庭服务机器人 下午11时 2025/03/21 作者 机器人大讲堂 海尔家庭机器人”)与北京星动纪元科技有限公司(以下简称“星动纪元”)在上海举行了战略签约仪式。 海尔
ICLR 2025 阿里等提出LLaVA-MoD,用MoE+蒸馏训练轻量化多模态大模型 下午4时 2025/03/07 作者 PaperWeekly 小模型的网络结构,并提出 Dense-to-Sparse 蒸馏框架,结合两阶段蒸馏策略(模仿蒸馏+偏
AAAI 2025 西交、港城大等提出LLMEmb,基于LLM的序列推荐嵌入生成器 下午4时 2025/03/01 作者 PaperWeekly 的论文,该论文已被 AAAI 2025 接收。这篇文章提出了一种新颖的 基于 LLM 的序列推荐推荐
14岁出道编程天才:新一代码农不会写代码了,AI正培养「文盲程序员」! 下午12时 2025/02/23 作者 新智元 一篇博客指出现代AI工具使程序员过度依赖快速解决方案而忽视了深度理解,引发了广泛讨论。