OpenAI重夺竞技场第一,但这波靠的是4o

OpenAI开发者日新加坡站举行,新版ChatGPT发布。此版本更新了创意写作能力,并且在多项具体能力和综合排名中表现突出。新版本击败Gemini-Exp-1114和Claude 3.5 Sonnet等竞争者,总胜率达到72%以上。OpenAI还透露即将上线的o1满血版及其开源计划引发了网友们的关注与讨论。

NeurIPS 2024 水印与高效推理如何两全其美?最新理论:这做不到

近日,DeepMind团队与马里兰大学研究人员在结合水印技术和投机采样方面取得进展。研究揭示了水印强度和采样效率之间的不可行定理,并提出了两种方法来平衡两者。研究表明,在保持检测效率或速度上存在权衡关系,未来需要设计新算法以应对这一挑战。

DeepSeek版o1炸场,数学代码超越OpenAI,每天免费玩50次,后续将开源

DeepSeek版o1来了,发布即上线。模型名为DeepSeek-R1-Lite,预览版在数学和代码任务上超越O1-preview,大幅领先GPT-4等。模型使用强化学习训练,推理越长表现更强。网友实测结果显示其数学能力较强,编码任务稍显不足。