Qwen2.5-7B-Instruct 归档

Deepresearch核心技术：如何通过强化学习增强推理大模型搜索规划及反馈能力？

2025年4月5日14时作者老刘说NLP

复现和应用越来越多，也对大模型的规划能力有了越来越多的要求。
假设大模型能力很强，我们可以使用
Co

2025年3月16日23时作者新智元

，在检索任务「大海捞针」（Needle-in-a-Haystack）测试中，新方法InfiniRet

2024年12月26日18时作者机器之心

机器之心报道
编辑：蛋酱、陈陈
最近，类 o1 模型的出现，验证了长思维链 (CoT) 在数学和编码

2024年12月5日20时作者 PaperWeekly

结论写在前面（太长不看版）
HiAR-ICL 通过引入高级推理模式到上下文学习（In-context