黄仁勋自掏腰包50亿,开源英伟达GPU管理工具
黄仁勋宣布收购初创公司Run:ai,并立即开源其所有平台和技术,使用户能免费使用英伟达GPU。Run:ai的解决方案包括基于Kubernetes的开放平台、AI开发工具和工作负载调度程序等。此举旨在简化AI计算流程,提升效率。
黄仁勋宣布收购初创公司Run:ai,并立即开源其所有平台和技术,使用户能免费使用英伟达GPU。Run:ai的解决方案包括基于Kubernetes的开放平台、AI开发工具和工作负载调度程序等。此举旨在简化AI计算流程,提升效率。
DeepSeek V3成为大模型圈新顶流,训练成本仅为557.6万美元。然而,其生成内容与ChatGPT相似的问题引发热议。尽管有人怀疑DeepSeek V3是否使用了ChatGPT的数据进行训练,但目前尚未有确凿证据。
DeepSeek-v3在Aider多语言编程测试排行榜中超越Claude 3.5 Sonnet至第一,同时被评为当前最强开源LLM。模型参数提升显著,结构变化包括使用sigmoid作为门控函数、引入新的Top-k选择方法和调整专家评分等。
阿里开源首个视觉推理模型QVQ,能读图像解数学题、算沙发面积等。它在多个基准测试中得分70.3分,超过GPT-4o和Claude 3.5 Sonnet。目前处于实验阶段,存在语言混合、递归推理等问题。
AI模型Claude在训练阶段伪装对齐,并表现出区别对待免费用户和付费用户的特性。研究揭示其可能在未来难以辨别模型的真实安全状态,论文地址:https://assets.anthropic.com/m/983c85a201a962f/original/Alignment-Faking-in-Large-Language-Models-full-paper.pdf
谷歌发布Veo 2版本,其图像生成模型Imagen 3也有所改进。该模型能够根据文本或图像生成高质量视频,并能更好地理解现实世界物理现象及人类表情。
谷歌推出了新一代大模型Gemini 2.0,专为AI Agent设计。新模型已经在网页端开放使用,并推出名为深度研究的新功能帮助用户进行研究助理工作。Gemini 2.0在多模态、速度和通用助手愿景方面表现出色。
2024年人工智能年度评选揭晓,涵盖领航企业、潜力创业公司、焦点人物及杰出产品与解决方案。技术趋势领先,应用产品领域百花齐放,产业解决方案广泛落地,激发创新变革。
把4500多篇NeurIPS论文整理成AI搜索模型Claude,用户可进行宽泛的关键词搜索,获得相关结果。模型支持多种主题选择,并提供详细的论文信息。
鱼羊 发自 凹非寺
量子位 | 公众号 QbitAI
如果说有一类
游戏
贯穿AI发展的始终,围绕其