跳至内容
每时AI

每时AI

  • 资讯
  • 国际
  • 分享
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 关于我们

视觉

可视化图解MOE大模型的7个核心问题:专家、路由、负载均衡及其用于视觉模态

下午7时 2025/03/02 作者 老刘说NLP

,可视化图解moe讲的挺不错,转载过来并做翻译,当作记录,值得收藏慢慢看。
原文在:https://

分类 大模型 标签 MoE、 文本、 稀疏参数、 老刘、 视觉、 计算效率 发表评论

一个全面且高效的参数高效微调(PEFT)方法汇总库

下午11时 2025/02/04 作者 NLP工程化

一个全面且高效的参数高效微调方法库,涵盖多种模型和方法,提供论文汇总、代码链接等资源。

分类 开源 标签 THUDM、 多模态、 未具体提及相关论文所在期刊或会议、 视觉、 语言、 选择性 1 条评论

Kimi思考模型k1.5是怎么练成的?细节曝光

下午2时 2025/01/22 作者 PaperAgent

Kimi发布新一代多模态思考模型k1.5,其在数学、代码、视觉和通用能力测试中达到或超越了GPT-4等领先水平。训练过程包括预训练、监督微调以及强化学习三个阶段,重点展示了数据构建、长上下文扩展及策略优化技术。

分类 分享 标签 k1.5、 kimi、 OpenAI、 代码、 数学、 视觉 发表评论

2025年 AGI AI AI技术 Anthropic ChatGPT Claude DeepSeek DeepSeek-R1 DeepSeek R1 GitHub GPT-4o LLM Manus Meta OpenAI Python Sam Altman 人工智能 人形机器人 具身智能 大型语言模型 大模型 大语言模型 字节跳动 开源 强化学习 微软 扩散模型 技术创新 智能体 木易 机器学习 深度学习 清华大学 生成式AI 用户体验 百度 腾讯 自然语言处理 英伟达 谷歌 阿里云 阿里巴巴 马斯克

近期文章

  • 78%主创跳槽!Llama 14名作者只剩3人,Meta最强开源模型团队大溃散引争议
  • 阿里云发布通义灵码 AI IDE,深度适配千问 3 大模型、新增编程智能体,可调用 3000+ MCP 服务
  • 新版DeepSeek R1你得这样用,太爽啦~
  • 工业级耐用之选!盈连砂带机:耐磨抗造,多材质打磨一“机”搞定
  • AI之父Hinton:想知道不是最聪明物种的感觉?去问鸡吧

分类

  • 分享
  • 国际
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 资讯
2025 年 5 月
一 二 三 四 五 六 日
 1234
567891011
12131415161718
19202122232425
262728293031  
« 4 月    

归档

  • 2025 年 5 月
  • 2025 年 4 月
  • 2025 年 3 月
  • 2025 年 2 月
  • 2025 年 1 月
  • 2024 年 12 月
  • 2024 年 11 月

AI新闻 | X平台 | APK反编译 | 京ICP备2024096144号 |
© 2025 每时AI • Built with GeneratePress
 下载我们的APP,AI秒送达!  立即下载
×