如何选择合适的LLM做擅长的事儿?P2L微调大模型进行路由选择的实现思路
2025年02月22日文章介绍了P2L(Prompt-to-Leaderboard)方法,通过训练一个大型语言模型来预测人类偏好投票,并用于评估和选择最适合特定用例的模型。
2025年02月22日文章介绍了P2L(Prompt-to-Leaderboard)方法,通过训练一个大型语言模型来预测人类偏好投票,并用于评估和选择最适合特定用例的模型。
在2024年12月,OpenAI发布了满血版o1,谷歌发布多个重要模型,DeepSeek发布升级版本。LMSYS和LiveBench排行显示,OpenAI o1、谷歌Gemini-Exp-1206、谷歌 Gemini-2.0-Flash-Thinking、DeepSeek V3分别位列排行榜前几名。