无需Attention的未来,RWKV-7能成为替代Transformer的那只黑天鹅吗? 下午2时 2025/03/24 作者 硅星GenAI 在Transformer计算需求呈平方级增长下,元始智能彭博提出RWKV架构融合了Transformer和RNN的优点,在训练与推理阶段均表现出色,并通过动态状态演化技术显著提升了性能表现。