GPT-5训练背后隐藏大佬:靠一篇博客入职OpenAI
研究员Keller Jordan仅凭一篇关于神经网络隐藏层优化器Muon的博客文章加入OpenAI,并可能用其训练GPT-5。Muon在CIFAR-10和NanoGPT等任务中表现出色,且内存需求低、运行效率高。
研究员Keller Jordan仅凭一篇关于神经网络隐藏层优化器Muon的博客文章加入OpenAI,并可能用其训练GPT-5。Muon在CIFAR-10和NanoGPT等任务中表现出色,且内存需求低、运行效率高。
《Understanding Deep Learning》是一本关于深度学习的专业书籍,涵盖理论基础、性能评估等多个主题,并附有大量练习题。
OpenAI 面临人员流失和财务压力,新成员离职加速。Alec Radford 是 OpenAI 的重要贡献者之一,即将离职寻求独立研究机会。公司目前面临成本增加、利润追求等问题。