预训练方法归档

奖励模型也能Scaling！上海AI Lab突破强化学习短板，提出策略判别学习新范式

2025年7月11日16时作者量子位

已成为AI迈向AGI进程中的关键技术节点。
然而，其中
奖励模型
的设计与训练，始终是制约后训练效果

文末送书全网催更的大模型爆款书《从零构建大模型》，中文版来了！

2025年4月27日14时作者机器学习算法与自然语言处理

《Build a Large Language Model (From Scratch)》是一本能教会普通开发者构建、训练和微调自己的大语言模型的实用指南。本书不仅解释了LLM理论及其未来，还提供了一套操作性强的路线图。作者深入浅出地讲解了从数据准备到模型部署的所有步骤，并新增了对DeepSeek模型的深度解析。

多模态模型已落地多领域，OpenBayes贝式计算获评「大模型最具潜力创业企业 TOP 10」

2025年1月2日16时作者机器之心

Ilya Sutskever在NeurIPS会议上提出预训练模型可能终结的观点，并强调未来AI需要更接近人类思考方式的推理能力。CB Insights报告显示，投资者偏好中小型且具有创新技术和可扩展商业模式的企业。OpenBayes作为大模型创业公司中的佼佼者，在多模态模型领域推出贝式小算，性能优越并成功应用于多个生产场景。

一	二	三	四	五	六	日
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30	31