今天是2025年4月27日,星期日,北京,晴。
今天做简短记录,来回顾下技术进展,比较新的就是MCP的综述。
抓住根本问题,做根因,专题化,体系化,会有更多深度思考。大家一起加油。
一、MCP,语音大模型及推理大模型相关进展
我们来看几进展,包括语音大模型,推理大模型以及MCP。
1、语音大模型进展,kimi开源voice模型,支持tts,stt,speech2speech等多种任务,encoder用的直接是whisper,然后多个模态融合,模型大小7b ,地址在https://huggingface.co/moonshotai/Kimi-Audio-7B-Instruct
2、推理大模型进展,推理能力实证分析,Does Reinforcement Learning Really Incentivize Reasoning Capacity in LLMs Beyond the Base Model,https://arxiv.org/abs/2504.13837,https://limit-of-RLVR.github.io,RLVR 与蒸馏训练存在本质区别。RL 仅能提升采样效率,而蒸馏训练能真正为模型注入新知识,还是需要搞基座。这些结论其实比较迷,各说各有理,核心还是要看实验环境。
3、MCP进展,一个综述,Model Context Protocol (MCP): Landscape, Security Threats, and Future Research Directions,https://arxiv.org/pdf/2503.23278,主要讲架构、核心组件、工作流程、服务器生命周期,以及在创建、运行和更新阶段的安全风险。
核心看3张图,如下:



(文:老刘说NLP)