4B Qwen3逆袭671B DeepSeek!字节DAPO微调方法这么猛的吗

最新小模型Jan-nano在多个基准测试中表现优秀,尤其在SimpleQA上得80.7分。它能进行深度研究、获取相关信息并优化MCP协议。Menlo Research提醒用户4B模型有限,但值得探索其潜力。Jan-nano基于DAPO强化学习微调方法开发,Jan-nano下载链接及Menlo Research官网均已公开。