什么是Post-Training?
谷歌DeepMind研究员Shane Gu提出后训练才是人工智能进化的关键观点,颠覆了传统认知。他强调微调是给AI补习特定课程,而后训练则是教会AI如何更好地思考和学习。后者被指出是一种在线学习方式,有助于持续进化和提升广泛能力。
谷歌DeepMind研究员Shane Gu提出后训练才是人工智能进化的关键观点,颠覆了传统认知。他强调微调是给AI补习特定课程,而后训练则是教会AI如何更好地思考和学习。后者被指出是一种在线学习方式,有助于持续进化和提升广泛能力。