CVPR满分论文!一块2080Ti搞定数据蒸馏,GPU占用仅2G
上交大EPIC实验室提出的新方法NCFM,利用辅助神经网络将数据集蒸馏转化为极小化极大优化问题。该方法在多个基准数据集中实现了显著性能提升,并展示了出色的可扩展性和下游任务应用能力。
上交大EPIC实验室提出的新方法NCFM,利用辅助神经网络将数据集蒸馏转化为极小化极大优化问题。该方法在多个基准数据集中实现了显著性能提升,并展示了出色的可扩展性和下游任务应用能力。
AAAI 2025 在美国费城举行,共有12957篇论文投稿,录取率为23.4%。南京大学团队的‘神经符号推理不一致性的高效修正’获杰出论文奖。此外还有一篇AI对社会影响特别奖得主论文入选。
Andrej Karpathy 在 YouTube 上发布了一段长达 2 小时的学习视频,详细介绍了如何使用大型语言模型(LLM),涵盖模型生态系统、交互示例和多种应用场景。
大模型面试经验不重要,但了解基础和好奇心加分。重点考察候选人对基础知识的理解、论文阅读能力及动手实践能力。能熟练使用不同流水算法并比较性能、实现自定义算子、掌握不同大模型 tokenizer 的差异等经历都可加分。