LLM 又过了一年!!!
MLNLP社区致力于推动机器学习与自然语言处理领域的交流合作,重点关注实践经验和新技术颠覆认知。2024年主题为’颠覆认知’,包括角色扮演模型、agent技术等新发展,探讨大模型在复杂任务上的应用及未来方向如合成数据、o1技术和agent模型。
MLNLP社区致力于推动机器学习与自然语言处理领域的交流合作,重点关注实践经验和新技术颠覆认知。2024年主题为’颠覆认知’,包括角色扮演模型、agent技术等新发展,探讨大模型在复杂任务上的应用及未来方向如合成数据、o1技术和agent模型。
最近,《Nature》发布全球AI研究领域TOP100高校榜单。哈佛、斯坦福和麻省理工学院位列前三,美国共有46所大学上榜。清华大学和北京大学分别排名第9和第14位。中国有19所高校上榜,为所有国家中增长速度最快的。
AI芯片系列B300和GB300发布,算力相比前代提升50%,显存从192GB增加到288GB,并且包含多个GB300的计算单元被评价为解决推理大模型内存限制的问题。
DeepSeek-v3在Aider多语言编程测试排行榜中超越Claude 3.5 Sonnet至第一,同时被评为当前最强开源LLM。模型参数提升显著,结构变化包括使用sigmoid作为门控函数、引入新的Top-k选择方法和调整专家评分等。