机器之心报道
编辑:杜伟
正如论文一作所说,「新架构 Titans 既比 Transformer 和现代线性 RNN 更有效,也比 GPT-4 等超大型模型性能更强。」
-
论文标题:Titans: Learning to Memorize at Test Time
-
论文地址:https://arxiv.org/pdf/2501.00663v1
(文:机器之心)
机器之心报道
编辑:杜伟
正如论文一作所说,「新架构 Titans 既比 Transformer 和现代线性 RNN 更有效,也比 GPT-4 等超大型模型性能更强。」
论文标题:Titans: Learning to Memorize at Test Time
论文地址:https://arxiv.org/pdf/2501.00663v1
(文:机器之心)