清华团队靠强化学习让 7B 模型打败GPT-4o数学推理

专注AIGC领域的专业社区分享了PRIME(Process Reinforcement through IMplicit REwards)算法在训练数学能力强大的7B模型方面的进展,该方法仅用8张A100、花费一万左右的成本,在不到10天内高效训练出了一个超过GPT-4和Llama-3.1-70B的7B模型Eurus-2-7B-PRIME,实现美国IMO选拔考试AIME 2024中准确率提升至26.7%。

被投资人们热捧的大模型创业者,都是啥背景?

中国大模型创业者的背景主要分为两类:互联网大厂技术骨干和顶尖高校科研工作者。头部独角兽企业背后的投资方多为顶级机构。其中,智谱AI在多项应用中领先,如GLM在语义理解和文档总结方面,而月之暗面则擅长处理长文本。但大模型商业化仍面临技术、硬件等挑战。

数万人在X上围观的Genesis,把「世界模型」造出来了?

来自多个知名大学和公司的团队推出了Genesis平台,它结合生成式AI与真实世界物理的准确性,提供通用物理引擎、机器人仿真平台等多样的功能。其目标是减少人类在数据生成中的投入,并实现自动化和自给自足的数据生态系统。