语言模型
Meta探索大模型记忆层,扩展至1280亿个参数,优于MoE
MLNLP 社区致力于促进 NLP 学术界、产业界及爱好者间的交流合作,Meta 新研究展示了记忆层在预训练语言模型扩展中的实用性和性能提升。
超越Claude 3.5紧追o1!DeepSeek-V3-Base开源,编程能力暴增近31%
DeepSeek AI开源最新混合专家语言模型DeepSeek-V3-Base,性能优于多个竞品模型,编程能力大幅提升。
清华深研院 AgentLand Festival 2025 Agent游戏开发年终盛会
清华大学AgentLand实验室举办Agent游戏工作坊,征集AI Agent游戏原型。活动涵盖线上投稿、线下试玩会和颁奖典礼,提供丰厚奖品及技术支持。
Andrej Karpathy:神奇大模型不存在的,只是对人类标注的拙劣模仿
知名AI学者Andrej Karpathy认为,大型语言模型的对话回答主要是模仿人工标注数据的结果,并非真正的人工智能。他批评了RLHF(奖励学习强化学习)的方法。
是宣传还是事故OpenAI Sora泄露API,完全开放语言模型OLMo 2,anthropic开放MCP旨在连接万物
本期内容涵盖了SoraVids、OLMo 2、StableAnimator、OneDiffusion和Model Context Protocol等五个AI项目。其中,SoraVids由desuAnon发布在Hugging Face平台,提供OpenAI视频生成模型Sora的视频及提示;OLMo 2是Ai2开发的完全开源语言模型;StableAnimator致力于高质量的人像动画生成,保持身份一致性并无需后处理;OneDiffusion是一个多功能的大规模扩散模型,支持双向图像合成和理解。Model Context Protocol则提供了一个新的标准连接AI助手与数据源,优化响应质量。
「学术版ChatGPT」登场!Ai2打造科研效率神器OpenScholar,让LLM帮你搞定文献综述
新智元报道
编辑:乔杨
【新智元导读】
Ai2和华盛顿大学联合Meta、CMU、斯坦福等机构发布了最