AI寒武纪
谷歌新招“我养你”:一年不工作,工资照发,只要不去竞争对手就可以
Google DeepMind 为了阻止员工跳槽到竞争对手公司,提出了一年‘花园假期’的政策。员工在此期间可以继续领取工资,但必须同意不得加入任何对手企业。这一举措让不少员工感到不便,尤其是在快速发展的 AI 行业中。
Andrej Karpathy最新发文:未来已来,这次技术红利,竟是普通人先“吃饱”
著名 AI 大牛安德烈·卡帕西的文章指出大语言模型(LLM)颠覆了技术普及的传统模式,普通人成为最早受益者。他分析了“万金油”与“专家团”、简单粗暴与精耕细作、灵活小船与笨重大船的不同,解释了为何 LLM 在企业和政府中的应用相对缓慢。
大瓜来了!Llama 4 陷刷榜争议:“内部员工”发帖控诉,测评版本被指特供?
一篇来自‘一亩三分地’论坛的帖子爆料称Meta的新大模型Llama 4训练效果未达开源SOTA基准,公司采取混入测试集数据以满足目标的做法引发争议。此外,TechCrunch质疑Meta在LM Arena排行榜上提交的版本可能与公开版不同,并认为这种行为可能误导开发者。
炸裂!Meta深夜推出Llama 4系列 :单卡H100能跑,千万上下文,还有2万亿“巨兽”
Meta发布了Llama 4系列首批模型,采用混合专家架构并支持多模态训练。推出了性能最强的小尺寸模型Scout、同级别最佳的Maverick以及正在开发中的Behemoth预览版。Llama 4 Scout和Maverick均支持高性能低成本比,实现了业界领先的1000万+ Token 多模态上下文窗口,并提供了智能调参技术和后训练策略优化。
R2前奏?DeepSeek联合清华新论文找到强化学习新方法:27B模型“干翻”671B
DeepSeek与清华大学合作的研究提出了一种通用奖励模型GRM及其改进方法SPCT,通过增加推理计算量实现了有效的推理时扩展,并显著提升了LLM的性能。
硬刚GPT4o!Midjourney V7上线:言出法随,还有杀手锏「10倍速“草稿模式”」
Midjourney宣布V7 Alpha测试版上线,新增草稿模式成本减半、渲染速度提升10倍等功能。模型理解能力更强,图像质量及细节处理改善显著。
AI复现顶尖AI论文?OpenAI最新测评:Claude 3.5得分第一
PaperBench测试了多款AI模型复现ICML 2024顶会论文的能力。结果显示,Claude 3.5 Sonnet表现最好,平均得分为21.0%。研究发现当前AI在长期规划、持续调试和策略执行方面存在问题。PaperBench为评估AI科研能力提供了量化标准,有助于加速科学发现并推动开放协作。
历史首次!GPT-4.5通过标准图灵测试,靠的竟是”装人设”?
UC San Diego团队通过实验验证GPT-4.5不仅通过了图灵测试,其表现甚至超过真人。胜率高达73%,远高于对照组人类对手的50%。研究发现人设提示是关键因素。
AI视频生成一夜被颠覆:Runway重磅发布Gen-4,保真度、动态性、一致性全面升级
Runway公司发布了新一代视频生成模型Gen-4,解决了场景一致性问题并增强了保真度、动态运动捕捉和可控性。Gen-4的核心优势包括高动态与真实感、高度一致性及精准理解与执行能力。