跳至内容
每时AI

每时AI

  • 资讯
  • 国际
  • 分享
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 关于我们

Llama

两岁的Llama,最初的14位作者已跑了11个!Mistral成最大赢家

下午4时 2025/05/27 作者 机器之心

帮助该公司制定了 AI 战略,某种程度上也改变了全世界的大模型格局。然而,令人意想不到的是,短短几年

分类 学术、 资讯 标签 AI、 Llama、 Llama 2、 Meta、 Mistral AI、 人才流失 发表评论

家庭服务机器人要逆天!Embodied-Reasoner:自动规划路径、搬运物品,复杂任务一网打尽

下午2时 2025/05/12 作者 小兵的AI视界

键桥梁。它要求智能体通过感知、推理和行动与物理环境动态交互,以完成复杂任务
。然而,
传统具身智能模

分类 开源 标签 Embodied-Reasoner、 Llama、 具身模型、 开源项目、 研究人员、 长序列交互 发表评论

模型压缩到70%,还能保持100%准确率,无损压缩框架DFloat11来了

下午4时 2025/04/28 作者 机器之心

卓越的能力。然而,它们迅速增长的规模给高效部署和推理带来了巨大障碍,特别是在计算或内存资源有限的环境

分类 学术、 资讯 标签 Dense-11、 DF11、 Gemma、 Llama、 LUT分解、 无损压缩 发表评论

LlaMa 4 翻车了!

下午4时 2025/04/07 作者 AGI Hunt

Meta 新发布的 LLaMa 4 模型疑似在训练过程中作弊,内部人士爆料团队直接将测试数据集塞进训练数据。AI 界对此事反响强烈,有人质疑 Meta 负责人是否知情,另有声音认为可能只是简单错误所致。

分类 分享 标签 Hyperbolic Labs、 Llama、 Meta、 Yuchen Jin、 不公平行为、 独立测试 1 条评论

1000万上下文!新开源多模态大模型,单个GPU就能运行

上午8时 2025/04/07 作者 AIGC开放社区

Meta 最新开源模型 Llama 4 Scout 达到千万级上下文,拥有 1090 亿参数。其使用 NoPE 架构解决长度泛化问题,并通过优化训练流程和强化学习框架提升性能。

分类 资讯 标签 Llama、 Meta、 NoPE、 Transformer、 在线强化学习、 混合专家架构 发表评论

速递|Meta AI研究灵魂人物将于5月离职,FAIR实验室转向产品部门的汇报,高层变动是否影响模型迭代?

下午4时 2025/04/02 作者 Z Potentials

Meta人工智能研究主管Joelle Pineau宣布将于5月离职,正值Meta在AI领域加大投资之际。

分类 国际、 资讯 标签 FAIR团队、 Joelle Pineau、 Llama、 Meta、 图像识别、 语音翻译 发表评论

OpenAI 开源!每小时亏666666美元的同时,软银400亿美元到位,估值飙至3000亿美元!

上午11时 2025/04/01 作者 AGI Hunt

直接愣住了
Sam Altman大大自己在X上亲自宣布了:
「
我们几个月内就会发布一款强大的开源语

分类 分享 标签 Karpathy、 Llama、 OpenAI、 Sam Altman、 增长、 开源 发表评论

Nature:科研人员最爱AI工具大盘点!从推理到编程,哪款才是最佳助手?

上午11时 2025/03/25 作者 新智元

本文介绍了当前科研人员青睐的AI模型:o3-mini、DeepSeek-R1、Llama、Claude 3.5 Sonnet和Olmo 2。它们各有优劣,但为科研人员提供了多样选择。

分类 资讯 标签 AI模型、 Claude 3.5 Sonnet、 DeepSeek-R1、 Llama、 O3-mini、 OLMo 2 发表评论

声音比真人还像真人的Maya,背后模型开源了!跨越语音恐怖谷

上午8时 2025/03/16 作者 机器之心

Sesame 发布逼真语音助手 Maya,通过情感智能、上下文记忆和高保真语音生成技术成功跨越了语音恐怖谷效应。CSM-1B 基础模型公开,拥有 10 亿参数规模,并允许商业用途。

分类 学术、 资讯 标签 Andreessen、 CSM-1B、 Llama、 Maya、 Meta、 RVQ 发表评论

北大团队提出LongRePS框架:面向长上下文场景的思维链过程监督方案

下午4时 2025/03/13 作者 PaperWeekly

上下文建模
研究简介
当前大语言模型(LLMs)在处理长上下文任务时面临核心挑战:如何在超长输入中有

分类 大模型、 学术 标签 Llama、 LongRePS、 大模型、 泛化能力、 过程监督框架、 长上下文任务 发表评论
较早文章
页面1 页面2 下一页 →

2025年 AGI AI AI技术 Anthropic ChatGPT Claude DeepSeek DeepSeek-R1 DeepSeek R1 GitHub GPT-4o LLM Manus Meta OpenAI Python Sam Altman 人工智能 人形机器人 具身智能 大型语言模型 大模型 大语言模型 字节跳动 开源 强化学习 微软 扩散模型 技术创新 智能体 木易 机器学习 深度学习 清华大学 生成式AI 用户体验 百度 腾讯 自然语言处理 英伟达 谷歌 阿里云 阿里巴巴 马斯克

近期文章

  • 盲测击败了ElevenLabs的一款TTS:Chatterbox
  • K8S集群化部署RAGFlow文档
  • DeepSeek 发布DeepSeek R1-0528
  • DeepSeek再次升级!R1-0528:站上世界第二,智力全面超越xAI与Meta!
  • WebDancer:迈向自主信息寻求的智能体

分类

  • 分享
  • 国际
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 资讯
2025 年 5 月
一 二 三 四 五 六 日
 1234
567891011
12131415161718
19202122232425
262728293031  
« 4 月    

归档

  • 2025 年 5 月
  • 2025 年 4 月
  • 2025 年 3 月
  • 2025 年 2 月
  • 2025 年 1 月
  • 2024 年 12 月
  • 2024 年 11 月

AI新闻 | X平台 | APK反编译 | 京ICP备2024096144号 |
© 2025 每时AI • Built with GeneratePress
 下载我们的APP,AI秒送达!  立即下载
×