跳至内容
每时AI

每时AI

  • 资讯
  • 国际
  • 分享
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 关于我们

70B

verl-pipeline:为大规模语言模型(LLM)的强化学习训练提供高效、灵活的解决方案

上午8时 2025/05/11 作者 NLP工程化

Agentica-project/verl-pipeline 提供高效灵活的解决方案支持高达70B参数模型和数百个GPU训练,集成多种主流LLM框架及强化学习算法。

分类 开源 标签 70B、 Agentica-project、 GitHub.com/agentica-project/verl-pipeline、 PPO、 大规模语言模型、 强化学习训练解决方案 发表评论

科大讯飞推出星火 X1 模型了

下午11时 2025/03/03 作者 陳寳

科大讯飞星火X1大模型参数量升级至70B,并在数学推理任务上超越DeepSeek R1和OpenAI o1。该模型通过算法优化与垂直场景深度融合,展现了国产AI大模型的技术实力和发展新路径。

分类 分享 标签 70B、 AI法官助理、 亿级医学知识、 数学推理、 星火大模型、 科大讯飞 发表评论

UMbreLLa:让大型语言模型在普通设备上也能高效运行的工具

上午8时 2025/01/25 作者 NLP工程化

UMbrellA 是一种工具,通过独特技术组合让70B级别模型在RTX 4070Ti上达到类似人类阅读速度的性能,特别擅长编程任务。

分类 开源 标签 70B、 Infini-AI-Lab、 RTX 4070Ti、 UMbreLLa、 特定技术组合、 类似人类阅读速度 1 条评论

微软Phi-4开源,14B的王~

下午2时 2025/01/09 作者 PaperAgent

微软发布Phi-4模型开源,参数规模14B,效果优于众多大模型,建议下载试用。

分类 分享 标签 14B、 70B、 GPT-4、 Phi-4模型、 人工智能模型、 微软 发表评论

PyTorch 原生FP8训练进展

下午10时 2025/01/08 作者 GiantPandaCV

PyTorch通过FSDP2、DTensor和torchao实现Float8训练提升吞吐量50%,展示了Float8在不同模型规模上的有效性,并进行了模型质量和评估基准验证。

分类 学术 标签 70B、 DTensor、 Float8、 FSDP2、 Meta LLaMa、 吞吐量提升 发表评论

2025年 AGI AI AI技术 Anthropic ChatGPT Claude DeepSeek DeepSeek-R1 DeepSeek R1 GitHub GPT-4o LLM Manus Meta OpenAI Python Sam Altman 人工智能 人形机器人 具身智能 大型语言模型 大模型 大语言模型 字节跳动 开源 强化学习 微软 扩散模型 技术创新 智能体 木易 机器学习 深度学习 清华大学 生成式AI 用户体验 百度 腾讯 自然语言处理 英伟达 谷歌 阿里云 阿里巴巴 马斯克

近期文章

  • 盲测击败了ElevenLabs的一款TTS:Chatterbox
  • K8S集群化部署RAGFlow文档
  • DeepSeek 发布DeepSeek R1-0528
  • DeepSeek再次升级!R1-0528:站上世界第二,智力全面超越xAI与Meta!
  • WebDancer:迈向自主信息寻求的智能体

分类

  • 分享
  • 国际
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 资讯
2025 年 5 月
一 二 三 四 五 六 日
 1234
567891011
12131415161718
19202122232425
262728293031  
« 4 月    

归档

  • 2025 年 5 月
  • 2025 年 4 月
  • 2025 年 3 月
  • 2025 年 2 月
  • 2025 年 1 月
  • 2024 年 12 月
  • 2024 年 11 月

AI新闻 | X平台 | APK反编译 | 京ICP备2024096144号 |
© 2025 每时AI • Built with GeneratePress
 下载我们的APP,AI秒送达!  立即下载
×