Claude团队开盒Transformer:AI大脑原来这样工作 下午11时 2025/03/28 作者 量子位 研究人员使用电路追踪方法揭示了大模型Claude的工作机制,包括其长逻辑推理、多语言处理和诗歌创作能力。
ICLR 2025 Spotlight SmODE: 神经常微分网络让深度强化学习的控制更加丝滑! 下午11时 2025/03/26 作者 极市干货 通过设计具有平滑特性的常微分方程作为神经元核心结构,构建平滑神经网络作为强化学习策略网络,显著提高
揭示Transformer「周期建模」缺陷!北大提出新型神经网络FAN,填补周期性特征建模能力缺陷 上午11时 2024/11/26 作者 新智元 新智元报道 编辑:LRST 【新智元导读】 北京大学研究团队开发的FAN模型能有效捕捉数据中的周期性