全面超越CoT!Meta田渊栋团队新作:连续思维链
Meta田渊栋团队提出的新范式Coconut(连续思维链)在LLM推理任务中性能更强、效率更高,通过移除模型头尾的LLM head和embedding层,并使用中间状态进行自回归。
Meta田渊栋团队提出的新范式Coconut(连续思维链)在LLM推理任务中性能更强、效率更高,通过移除模型头尾的LLM head和embedding层,并使用中间状态进行自回归。
Google Deepmind 推出的新视频模型 Veo 2 和 Imagen 3 提供了更高分辨率的视频生成能力,并改进了指令识别和物理现象模拟功能。Veo 2 还引入了不可见的 SynthID 水印以确保其 AI 生成属性,而 Imagen 3 在多个国家推出的同时支持多种艺术风格的图像创作。
本周会员通讯解读AI & Robotics领域内三则重要资讯:一是探讨如何通过不同思路实现更强的人工智能;二是讨论关于元宇宙、皮卡丘世界模型以及Meta的技术布局;三是诺奖得主论坛的焦点话题及应用中的潜在副作用。
OpenAI的Grok 3、Meta的Llama 3.3以及谷歌的新Gemini模型相继发布,引发热议。Llama 3.3表现出色,70B版本能实现405B的效果,并且成本更低;Gemini则成为最新lmsys大模型竞技场的榜首。此外,马斯克xAI的Grok 3也在传言中即将推出。