日期: 2025 年 2 月 21 日
大模型推理部署的几个基本认知及prompt压缩策略用于COT推理微调尝试
2025年02月21日星期x,介绍了大模型推理压缩策略,包括TokenSkip方法用于Controllable Chain-of-Thought(COT),通过分析和剪枝减少冗余token提高推理效率。相关研究文献推荐加入了LoRA微调技术。
机器人风起云涌!海外两大独角兽先后巨额融资
人形机器人初创公司Figure AI计划以395亿美元的估值获得15亿美元融资,并在未来几年生产10万台人形机器人。另外一家初创公司Field AI也获得了数亿美元融资,估值从5亿美元跃升至20亿美元。
音乐检索进入“多模态对齐”时代:清华 CLaMP-3 的三大极限突破
清华大学朱文武教授团队推出的CLaMP 3是一款多模态、多语言的音乐信息检索框架,实现了跨模态检索和零样本分类等功能。它支持27种语言,并基于对比学习训练模型,使用XLM-R预训练模型实现强大的多语言文本嵌入。
【揭秘】AI幻觉:DeepSeek是如何产生幻觉的?如何应对与发挥创造力价值!
文章介绍了AI幻觉的概念及其对用户的影响,并探讨了DeepSeek大模型中存在的问题及解决方案。通过技术方案和技术策略的有效应用,可以减少AI幻觉对用户的负面影响,同时发掘其潜在创造力价值。