Gemini-Exp-1206归档

如何选择合适的LLM做擅长的事儿？P2L微调大模型进行路由选择的实现思路

下午2时 2025/02/22 作者老刘说NLP

2025年02月22日文章介绍了P2L（Prompt-to-Leaderboard）方法，通过训练一个大型语言模型来预测人类偏好投票，并用于评估和选择最适合特定用例的模型。

2024年12月LLM最新排名：o1、Gemini双雄争霸，DeepSeek黑马杀入！

下午2时 2025/01/02 作者 AI信息Gap

在2024年12月，OpenAI发布了满血版o1，谷歌发布多个重要模型，DeepSeek发布升级版本。LMSYS和LiveBench排行显示，OpenAI o1、谷歌Gemini-Exp-1206、谷歌 Gemini-2.0-Flash-Thinking、DeepSeek V3分别位列排行榜前几名。

一	二	三	四	五	六	日
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30