为什么说Scaling Law是宇宙的一种属性?
在Sam Altman与Daniel Selsam的对话中,讨论了GPT-4.5实验验证扩展法则的有效性。Daniel认为智能源于压缩,宇宙知识是可挖掘的分形。随着模型规模增加,能捕捉到更多稀疏但重要的概念,导致性能提升。这引发问题:为什么训练更大模型更有效?智能是否像宇宙一样无限复杂且可压缩?
在Sam Altman与Daniel Selsam的对话中,讨论了GPT-4.5实验验证扩展法则的有效性。Daniel认为智能源于压缩,宇宙知识是可挖掘的分形。随着模型规模增加,能捕捉到更多稀疏但重要的概念,导致性能提升。这引发问题:为什么训练更大模型更有效?智能是否像宇宙一样无限复杂且可压缩?