跳至内容
每时AI

每时AI

  • 资讯
  • 国际
  • 分享
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 关于我们

微调优化

Agent性能优化技术总结及DeeResearch用于Github项目搜索实现思路

下午2时 2025/04/03 作者 老刘说NLP

智谱AutoGLM沉思,都引起了大家的关注。
这其实引出来一个观点,关于Agent研发重心。文章(h

分类 大模型 标签 LLM、 参数驱动、 多智能体协作、 强化学习、 微调优化、 无参数优化 发表评论

10篇R1相关的研究全面汇总,万字思考!

下午7时 2025/03/21 作者 Datawhale

LLM的新范式。其核心就是如何进一步增强LLM的能力。
本文中的相关阅读,可以在主页找到对应文章:

分类 分享 标签 LLM性能、 R1论文、 多模态应用、 微调优化、 数据质量、 深度技术 发表评论

AI进入推理模型时代,一文带你读懂思维链

下午12时 2025/03/15 作者 机器之心

译
近段时间,推理模型 DeepSeek R1 可说是 AI 领域的头号话题。用过的都知道,该模型在

分类 学术、 资讯 标签 复杂系统、 开源工具、 微调优化、 成本分析、 自然语言处理、 链式推理 发表评论

多模态大模型在表格解析任务上效果如何?亲身经历全是泪!

下午2时 2024/12/27 作者 机器学习算法与自然语言处理

MLNLP
社区是国内外知名的机器学习与自然语言处理社区,受众覆盖国内外NLP硕博生、高校老师以及企

分类 学术 标签 多模态学习、 微调优化、 数据不平衡、 模型复杂度、 结构感知不足、 表格解析 发表评论

2025年 AGI AI AI技术 Anthropic ChatGPT Claude DeepSeek DeepSeek-R1 DeepSeek R1 GitHub GPT-4o LLM Manus Meta OpenAI Python Sam Altman 人工智能 人形机器人 具身智能 大型语言模型 大模型 大语言模型 字节跳动 开源 强化学习 微软 扩散模型 技术创新 智能体 木易 机器学习 深度学习 清华大学 生成式AI 用户体验 百度 腾讯 自然语言处理 英伟达 谷歌 阿里云 阿里巴巴 马斯克

近期文章

  • 基准测试揭秘大模型“字数危机”:26个模型长文本生成普遍拉胯,最大输出长度过度宣传
  • 实测思维链大变!DeepSeek R1一个“小升级”性能直逼o3,但仍“过度思考”?
  • 原来Veo 3早有苗头!人大联合值得买科技在CVPR 2025提出全新「图像到有声视频」生成框架
  • 第一批追赶AI的人,正在被AI甩开
  • AI仅凭“自信”学会推理,浙大校友复刻DeepSeek长思维链涌现,强化学习无需外部奖励信号

分类

  • 分享
  • 国际
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 资讯
2025 年 5 月
一 二 三 四 五 六 日
 1234
567891011
12131415161718
19202122232425
262728293031  
« 4 月    

归档

  • 2025 年 5 月
  • 2025 年 4 月
  • 2025 年 3 月
  • 2025 年 2 月
  • 2025 年 1 月
  • 2024 年 12 月
  • 2024 年 11 月

AI新闻 | X平台 | APK反编译 | 京ICP备2024096144号 |
© 2025 每时AI • Built with GeneratePress
 下载我们的APP,AI秒送达!  立即下载
×