Datawhale经验
作者:Datawhale团队
首先,祝每位 25 考研的同学明天都有好成绩!

零、 前言
一、 考研流程扫盲
1月 – 9月 收集信息和备考
-
中国研究生招生信息网(研招网):这是官方发布考研信息的权威平台,涵盖了全国各高校的招生政策、专业目录等重要内容。 -
学校研究生官网:各高校的研究生院官网会发布具体的招生简章、专业介绍、报考要求等信息。 -
直系学长学姐:向已经考过研的学长学姐咨询,他们的经验往往更具针对性和实用性。 -
网络平台:如B站、知乎、QQ群等,这些平台上有大量考研相关的经验分享和资料整理。但需要注意的是,网络信息可能存在夸大或不实的情况,需谨慎甄别。
-
学校研究生官网:查看招生简章、专业目录、报考要求等。 -
研招网:获取全国范围内的招生信息。 -
院校官网:例如,以北京大学研究生院为例,其官网会详细展示招生工作安排、专业目录、报考点要求等内容。
-
招生人数:了解目标专业的招生规模。 -
学费:确认目标专业的学费标准。 -
报录比:了解竞争激烈程度。 -
往年复试分数线:作为参考,评估自己的实力与目标之间的差距。
-
公共课: -
政治:所有考生必考科目,内容涵盖马克思主义基本原理、毛泽东思想和中国特色社会主义理论体系等。 -
英语:分为英语一和英语二,两者的难度和题型有所不同。英语一通常难度较高,适合学术型硕士;英语二相对简单,适合专业型硕士。 -
数学:根据专业不同,分为数学一、数学二和数学三,难度和考查范围也有所差异。 -
专业课: -
统考(408):包括数据结构、计算机组成原理、操作系统和计算机网络四门课程。 -
自命题:各高校自主命题,考查内容和形式因学校而异。例如,有的学校可能只考数据结构,有的则可能考查数据结构加计算机网络等。 -
对于计算机专业,专业课主要分为统考和自命题两种形式:
9月 – 11月 备考和报名
A、研招网报名
-
1. 考研大纲查询:每年9月发布最新考研大纲,变动幅度通常不超过5%(如2023年英语一新增图表作文题型,此前十年均为图画作文) -
2. 报名系统入口:全国硕士研究生招生唯一官方通道(网址:https://yz.chsi.com.cn) -
3. 数据验证平台:提供各院校历年报录比、推免生占比等关键数据查询
-
双重作用:① 报名系统压力测试 ② 考生操作演练(建议所有考生参与) -
注意事项:✓ 成功标志:生成9位报名号+完成缴费(支持支付宝/银联) ✓ 证件照要求:JPG格式、白底免冠、文件大小100KB以内(建议9-10月拍摄)
-
修改权限说明:

B、招生简章深度解析

C、网上确认标准化流程
-
1. 身份证明:手持身份证照片(需露出双臂,身份证信息清晰可辨) -
2. 学历证明:应届生提交《教育部学籍在线验证报告》,往届生提供学位证编号 -
3. 属地证明:非户籍地考生需上传社保缴纳记录/居住证(具体要求见报考点公告) -
4. 审核时效:提交后48小时内反馈结果,建议至少预留2次修改机会
12月 – 次年5月 考试和复试
A、考前准备(12月)
-
准考证打印:12月中旬下载PDF文件(建议保存电子版备份) -
考场确认: -
报考点为非本校考生需提前预定考场周边住宿 -
考前1天实地确认考场位置与交通路线
B、初试与成绩查询
-
考试时间:12月倒数第二个周末(每天8:30-11:30/14:00-17:00) -
成绩公布:次年2月下旬可通过研招网/省级教育考试院官网查询 -
分数线发布:✓ 34所自划线院校:2月下旬公布(通常高于国家线) ✓ 国家线:3月上旬由教育部统一划定
C、复试与调剂(3-4月)
-
1. 考核形式: -
常见组合:机试+专业课笔试+综合面试 -
特殊要求:部分院校取消机试和笔试,只有综合面试(以复试通知为准) -
2. 必备材料:中英文简历、科研成果证明、导师联系邮件模板
-
开放时间:国家线公布后1周(约3月中下旬) -
填报规则:✓ 同时填报3个平行志愿 ✓ 锁定时间不超过36小时
D、录取流程(4-5月)
-
1. 拟录取确认:收到通知后24小时内需回复确认 -
2. 入学审查: -
体检报告(二甲以上医院) -
政审表(需加盖公章) -
3. 档案调取:5月通过EMS机要通道转递(应届生延至7月)
二、学校选择
1. 相关资料
A、报考规则特殊性
-
唯一志愿制:考研仅允许填报1所院校的1个专业(与保研/调剂的三平行志愿形成对比) -
决策前置性:需在备考初期完成精准择校
B、核心信息平台
-
1. 研招网(优先级★★★★★) -
查询内容:历年招生简章、实际录取人数、推免生占比 -
覆盖范围:全国院校的完整数据 -
2. 学院研究生官网(优先级★★★) -
补充查询:专业课程设置、导师研究方向 -
预警信号:信息更新频率低于年更/数据不全的院校需谨慎
C、真题获取途径

D、数据分析维度
-
1. 分数线趋势 -
重点观测:近三年国家线与院校线的分差变动 -
风险提示:连续两年涨幅>15分的专业慎报 -
2. 报录比解析 -
计算公式:实际统考录取人数/当年报考人数 -
警戒阈值:超过1:20的竞争比需重新评估自身实力 -
3. 政策变动监测 -
关注重点:教育部学科评估结果(C-以下专业存在停招风险) -
典型案例:某985院校软件工程专业因学科评估未达标,2024年实际录取人数归零
E、战略层面考量
-
1. 政策风向标:定期查看教育部官网「学位管理与研究生教育司」公告 -
2. 院校动态:订阅目标院校研招办微信公众号获取实时通知
2. 学校选择
A、院校选择决策矩阵

B、特殊招生单位对比表

C、发展路径决策树

3. 专硕和学硕的选择
A、核心差异对比表

B、关键决策因素解析
-
1. 职业规划导向 -
科研/高校教职:必选学硕(博士申请通过率有加成) -
央国企/公务员:优先学硕(岗位要求明确标注) -
民营企业就业:专硕性价比更高(节省1年时间成本) -
2. 经济成本核算(举例)

-
3. 深造路径选择 -
硕博连读:仅学硕可申请(部分院校允许专硕转博) -
海外读博:学硕科研成果更受认可(SCI论文权重高)
三、初试和复试准备
1. 初试
-
重点完成学科知识框架搭建 -
数学科目需系统梳理基础知识点 -
日均学习时长6-8小时(兼顾在校课程)
-
暑期黄金期保持每日10小时高效学习 -
核心任务:真题训练/错题整理/加深知识点理解 -
专业课重点突破代码实践能力
-
侧重模考训练与重难点知识强化 -
协调毕业设计等校务安排
-
优先保证考研核心科目每日3小时学习 -
利用碎片时间进行知识点记忆 -
考试周适当减少考研复习强度
-
数学一:涵盖高数/线代/概率论,建议数学基础薄弱者慎选 -
数学二:侧重高数与线代,适合工科跨考生 -
数学三:经济类专用,注重计算能力训练
-
基础阶段:确保知识点100%覆盖,允许查阅教材完成基础题型 -
强化阶段:建立知识网络图谱,严格闭卷完成《660题》等经典题库 -
冲刺阶段:每日3小时限时模考(推荐李林4/6套卷+超越共创),重点分析2010年后真题

-
英语考试一共100分,阅读理解占40分,所以得阅读者得天下,阅读的基础是词汇,所以要坚持背单词。
-
每个阶段都不要落下背单词。

-
冲刺型(10月启动):肖八选择+肖四大题+腿姐押题班 -
稳健型(7月启动):徐涛强化班+肖1000题+冲刺背诵手册 -
高分型(3月启动):核心考案系统学习+真题分类训练

-
基础阶段:知识点记忆并刷王道单科书选择题 -
强化阶段:二刷知识点并进行大题专项训练 -
冲刺阶段:近15年真题限时模考+模拟卷查漏
-
信息战策略: -
收集近5年真题(校研招办/考研论坛) -
获取本校本科期末试题(目标院校打印店) -
分析考纲变更规律(对比近3年大纲变动) -
应试技巧: -
针对简答题建立标准化答题模板 -
代码题重点刷一刷leetcode,主要锻炼代码思路
-
1. 成绩等待期关键动作: -
完善毕设项目(可能成为面试提问素材) -
持续英语口语训练(每日跟读TED演讲20分钟) -
2. 核心能力储备清单: -
专业前沿动态追踪(关注顶会论文摘要) -
科研潜力证明材料(整理竞赛/专利成果) -
压力面试模拟训练(组队进行全真mock)
2. 复试
A、复试核心资料获取策略
-
1. 有效信息筛选原则 -
目标院校研究生院官网复试细则(含机试大纲) -
近3年录取考生简历模板(通过学术社交平台联系在读研究生获取) -
优先渠道:知乎/CSDN目标院校上岸经验贴(重点阅读3年内高赞帖) -
避坑指南:警惕以”复试题库”为名的付费资料(实测60%内容与真题无关) -
核心资源:
B、简历制作方法论
-
1. 内容构建黄金法则(STAR-L模型)

-
2. 紧急补救方案(针对无科研经历者)
-
Kaggle实战路径:① 选择Getting Started级别竞赛(如Titanic) ② 复现TOP10方案并改进特征工程(需在GitHub构建完整项目) ③ 形成技术报告(含EDA/模型对比/可视化) -
课程设计升级法:例如将数据库课程设计重构为”高并发场景下的Redis缓存优化实践”
C、面试攻防体系构建
-
1. 专业能力考察矩阵

-
2. 死亡问题应答模板
-
项目薄弱环节:”在开发过程中,我们发现当数据量超过10万条时模型推理速度下降40%,通过引入模型剪枝技术将延迟降低到原水平的75%,这个教训让我们更重视生产环境的性能优化” -
知识盲区:”关于您提到的联邦学习隐私保护机制,我在课程设计中主要聚焦于模型优化方向,面试结束后我会立即研读《Federated Learning》第三章相关内容”
D、机试备战方案
-
1. 训练体系
-
主要熟悉C语言代码,并通过leetcode锻炼代码思维 -
参考资料:《算法导论》、《代码随想录》、《C语言程序设计》
-
2. 考场应急策略
-
遇到未知算法题时,先写出暴力解法确保基础分 -
复杂代码先写伪代码注释,避免思路中断
E、资源支撑体系
-
机器学习基础:《南瓜书》公式推导逐行精解 -
深度学习实战:《深入浅出PyTorch》配套Notebook -
算法强化:《LeetCode》高频题型分类解析
四、专业和导师选择
1. 专业选择
A、信息获取路径
-
官方渠道:① 目标院校研究生招生网(关注招生简章/推免比例/新增研究院) ② 教育部学位中心(查询第四轮学科评估结果) ③ 军校招生信息网(部分专业面向普通考生开放) -
隐蔽机会点: -
新成立学院(如智能工程学院/未来技术学院)首年招生竞争较小 -
交叉学科项目(如生物信息学/金融科技)更易实现专业转型 -
不同学院的联合培养(如医学院和计算机学院),特别是首次招生时竞争小
B、决策评估矩阵

C、典型误区规避
-
概念混淆:区分”研究方向”(如大模型应用)与”学科专业”(计算机科学与技术) -
校区差异:同一学校的不同校区相同专业,招生分数可能不同,并且侧重方向不同,例如:哈工大本部和哈工大深圳
2. 导师选择
A、招生资格确认路径
-
显性渠道:① 学院官网导师名录(标注”硕士生、博士生导师”身份) ② 当年研究生招生目录(附导师联系方式) -
隐性渠道: -
新引进人才(查看学校人事处公示) -
跨学科导师(关注交叉研究院招聘公告)
B、导师评估五维模型

C、导师匹配策略
-
学术型路径:选择IEEE Fellow/杰青(注重顶刊发表记录、有无帽子和重大基金项目) -
就业型路径:优选有企业顾问经历的导师(关注横向课题数量) -
创业型路径:锁定科技园孵化项目负责人(查询工商注册信息)
D、风险预警机制
-
人品评估: -
使用”导师评价网”、”知乎”、”小红书”等渠道数据交叉验证(注意筛选近3年评价) -
实地考察实验室氛围(通过视频会议观察师生互动) -
不要只通过老师给本科生上过课来判断一个老师是否合适做导师,这是一种不靠谱的操作 -
延毕预警: -
统计近5年毕业生学制(超过标准学制30%需警惕) -
关注课题组博士转硕比例(高于20%谨慎选择)
五、大模型研究方向
1. AI发展脉络
A、AI研究方向
-
结构化数据处理:以数字为对象,例如股票价格预测; -
自然语言处理(NLP):针对文本数据,如对话系统、文本分析; -
计算机视觉(CV):处理图像信息,应用于自动驾驶、目标识别等场景; -
音频处理:如语音识别、同声传译等技术; -
时序数据处理:分析时间序列数据,例如天气预测。
B、AI核心研究方法
-
监督学习:基于“问题-答案”数据集训练模型,例如通过“1+1=2”等示例让模型学习数学规律; -
无监督学习:从无标注数据中自主挖掘规律,典型应用如通过海量文本训练语言模型; -
强化学习:通过环境反馈优化决策,例如AlphaGo通过不断试错提升围棋水平。
C、NLP技术演进与大模型诞生
-
符号主义阶段:早期基于语法规则处理文本,类似传统语言学的分析方法; -
语义表征与统计学习:将文本转化为数字向量(如词频统计、词嵌入),结合决策树等模型提取规律; -
深度学习时代:神经网络实现端到端学习(如机器翻译),2017年Transformer架构的提出成为关键转折点; -
预训练+微调范式:模型先通过海量文本预训练学习通用知识,再针对特定任务微调,类似人类“先广泛学习再专项突破”; -
大模型时代:以GPT-3、Llama系列、Qwen系列等为代表的大规模预训练模型,在语义理解、生成能力上实现质的飞跃,推动NLP进入全新发展阶段。
2. 大模型研究方向
A、大模型研究方向框架
-
1. 基座研究(底层技术突破) -
2. 衍生研究(性能优化与安全增强) -
3. 应用研究(场景落地实践)
B、基座研究:技术突破的深水区
-
1. 新型模型架构探索 -
MOE架构(混合专家系统):如DeepSeek-V3等模型采用分治策略提升推理效率 -
端侧推理小模型:MiniCPM-MoE等可在手机/平板运行的轻量化多模态模型 -
2. 预训练数据配比优化 -
通过数据筛选与配比提升训练效率(参考DeepSeek-R1报告,500万美元训练出对标GPT-4的模型) -
3. 偏好对齐技术 -
主流方法:PPO(近端策略优化)、DPO(直接偏好优化)等强化学习技术 -
学习资源:开源教程easy-rl、TRL仓库技术博客
-
算力需求:预训练需数十张A100级显卡支持 -
研究主体:集中于头部985高校(如清华、北大)及大厂研究院 -
择校建议:需重点考察导师团队是否具备基座研究能力
C、衍生研究:性能优化与安全攻坚
-
1. 数据合成技术 -
利用大模型生成垂类数据(如生物、医学、化学、物理领域),训练专用小模型 -
2. 可信AI研究 -
防御提示词攻击(如”奶奶病危需激活码”等诱导漏洞) -
3. 模型轻量化技术 -
知识蒸馏:将大模型能力迁移至小模型 -
量化压缩:FP32→INT8等精度转换技术 -
推理加速框架:ollama、vLLM、lmdeploy等开源方案
D、应用研究:技术落地的黄金赛道
-
1. 垂直领域应用 -
典型案例:法律大模型、金融财报分析模型、医疗诊断大模型 -
2. 多智能体系统 -
应用场景:顺丰物流智能调度(7类Agent协同)、智慧城市管理 -
开源框架:Swarm、Qwen-Agent、CamelAI、MetaGPT等 -
3. 提示词工程 -
优化技巧:结构化指令、思维链(CoT)等Prompt设计方法 -
4. 智能体编排 -
工作流设计:多Agent任务分配与协同机制
E、研究门槛对比和考研择向建议

-
1. 学术向:优先选择清北/头部985的基座研究团队 -
2. 工程向:聚焦模型压缩、多智能体等衍生技术 -
3. 应用向:从提示词工程、垂类模型开发切入


(文:Datawhale)