
虽然总是拼错他的名字,但他却在大模型的混沌中,一次次救了我。搜索一下,发现这哥们还挺“反差萌”,不拍炫技视频、不走网红路线,安安静静地搞教程。
读完这本书,你会学到什么:
🔹从零开始:自己动手构建模型架构!
🔹 模型训练:教你如何准备数据、搭建训练管道,并优化模型效果!
🔹 让 LLM 更聪明:微调、加载预训练权重,让你的 LLM 适应不同任务!
🔹 人类反馈微调(RLHF):让 LLM 学会理解指令,避免胡言乱语!
🔹 轻量级开发:一台普通笔记本就能跑,告别「算力焦虑」!

但你别说,他出的教程,是真的火,从机器学习、深度学习,到如今的大模型,他几乎每一步都走在最前面。
就连 Designing Machine Learning Systems 的作者 Chip Huyen 都曾转发他的项目说“这是学习大模型底层原理的绝佳资源”。
十几年前,Sebastian Raschka 还是个学生,在一个统计模式分类课程上,他完成了首个独立项目:一个能通过歌词识别歌曲所蕴含情绪的模型,以及相应的网页应用程序。别人草草交个作业了事,他不仅建了模型,还能跑起来。
就是这事儿,一下子点燃了他对 AI 的热情。
之后几年,他打怪升级,一路自学、深挖、分享,从机器学习写到神经网络,从 YouTube 视频分享到 GitHub 开源项目,每一步都稳扎稳打。
这本书不是“AI 概念小册子”,更没有虚的东西,是你真正能用上的实打实的方法。
Sebastian 的风格一向都很直接:“我不是大神,我只是一个把复杂问题讲清楚的人。”
所以别怕自己基础薄弱,起点低,跟不上——他写书不是为了给大佬拍手看的,是写给你我这样的普通开发者的!




最妙的是,他的教程不仅靠谱、清晰、能跑通,重点是——你能看懂!
就连 Hugging Face 上让人头大的文档,他都能顺顺溜溜地讲明白,还能带你一步步手搓大模型。
作者教学视频地址:
https://space.bilibili.com/3546869640726821
可以说学习大模型这一路并不轻松,但好在有人走在前面,把路写成了文档。
如果你正准备入门大模型开发,就来翻翻这本书吧!一定不会让你失望。
作译者是谁?
现在大模型独角兽公司 Lightning AI 任资深研究工程师。博士毕业于密歇根州立大学,2018~2023 年威斯康星大学麦迪逊分校助理教授(终身教职),从事深度学习科研和教学。
除本书外,他还写作了畅销书《大模型技术30讲》(图灵已出版:不管哪个大模型火,你都绕不开这30个核心技术)和《Python机器学习》。
译者冯骁骋,哈尔滨工业大学计算学部社会计算与交互机器人研究中心教授,博士生导师,人工智能学院副院长。研究兴趣包括自然语言处理、大模型等。在 ACL、AAAI、IJCAI、TKDE、TOIS 等 CCF A/B 类国际会议及期刊发表论文 50 余篇。
译者刘乾,新加坡某公司的研究科学家,主要研究方向是代码生成与自然语言推理。他在顶级人工智能会议(如ICLR、NeurIPS、ICML)上发表了数十篇论文,曾获得 2020 年百度奖学金提名奖、北京市 2023 年优秀博士论文提名奖、2024 年 KAUST Rising Stars in AI 等荣誉。
主审人简介
车万翔,哈尔滨工业大学计算学部长聘教授,博士生导师,人工智能研究院副院长,国家级青年人才,斯坦福大学访问学者。
黄科科,中南大学教授,博士生导师,自动化学院副院长,国家级青年人才。
我们已迈入了 AI 时代,深刻理解大模型的工作机制极有必要,而这本书可谓深入理解主流生成式AI的实践指南。本书以“亲手构建才是真理解”为核心理念,带领读者从零搭建类 GPT 模型,作者以工程师视角剖析LLM黑箱,通过清晰的代码示例与模块化拆解,完整覆盖模型架构设计、预训练、指令微调等核心环节,是掌握 Transformer 时代模型精髓的必读之作。
——张俊林,新浪微博首席科学家 & AI 研发部负责人
作为一名大模型从业者,我自认为对书中大部分内容已经足够熟悉,但当我看到书稿的时候,仍忍不住认真读了一遍,因为这种文字、代码、图示、注释四合一的讲解方式实在太引人入胜了。不得不说,这是一本从零入门大模型的难得的好书!
——苏剑林,NLP知名博客“科学空间”博主
这真是一本鼓舞人心的书!它激励你将新技能付诸实践。
——Benjamin Muskalla,GitHub 高级工程师
这是目前对语言模型最通俗易懂且全面的解析!其独特而实用的教学方式,能够达到其他方式都无法企及的理解深度。
——Cameron Wolfe,Netflix 资深科学家
塞巴斯蒂安不仅能够将深邃的理论知识与工程实践完美结合,更拥有化繁为简的魔力。这正是你需要的指南!
——Chip Huyen,《设计机器学习系统》与 AI Engineering 作者
本书内容权威且前沿,强烈推荐!
——Vahid Mirjalili博士,FM Global高级数据科学家
(文:AI技术研习社)