AI每日速报 | 2025-05-04
微软推出Phi-4-reasoning提升SLM效率;Anthropic的Claude打通第三方应用并新增搜索功能;谷歌AMIE项目结合医疗影像进行对话式诊断;OpenAI公开GPT-4o“谄媚”问题修复进展;艾伦研究所发布透明模型OLMo-2-1B。
微软推出Phi-4-reasoning提升SLM效率;Anthropic的Claude打通第三方应用并新增搜索功能;谷歌AMIE项目结合医疗影像进行对话式诊断;OpenAI公开GPT-4o“谄媚”问题修复进展;艾伦研究所发布透明模型OLMo-2-1B。
上海AI Lab/清华哈工大/北邮团队的研究表明,通过改进Test-Time Scaling(TTS)方法,在数学推理任务上提升了小模型的性能。该研究发现最优的TTS方法高度依赖于具体的策略模型、过程奖励模型和问题难度。