跳至内容
每时AI

每时AI

  • 资讯
  • 国际
  • 分享
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 关于我们

科研心得

GRPO=高级版拒绝采样?强化学习祛魅时刻:负样本“去芜存菁”才是关键!

下午4时 2025/05/20 作者 PaperWeekly

PO 这样的算法虽然主流,但它需要额外的网络(critic network),搞得比较复杂和麻烦。

分类 大模型、 学术 标签 公开渠道、 原创作品、 学术热点、 投稿通道、 科研心得、 论文解读 发表评论

什么样的图像才是好的图像?近200篇文献总结图像质量检测的最新进展与挑战

下午11时 2025/03/24 作者 PaperWeekly

ts, Analysis, and Future Outlook
作者单位:
北京大学、厦门大学
论

分类 大模型、 学术 标签 PaperWeekly、 大众科普受众、 学术论文解读、 学生、 研究者、 科研心得 发表评论

货拉拉等发布LalaEval:面向领域大模型的端到端人工评测框架

下午11时 2025/01/14 作者 PaperWeekly

©PaperWeekly 原创 · 作者 |
孙崇衍
单位 |
香港中文大学博士生
研究方向 |
大

分类 大模型、 学术 标签 业内竞争力稿酬、 原创作品、 学术热点剖析、 科研心得、 竞赛经验讲解、 论文解读 发表评论

NeurIPS 2024 突破现有方法瓶颈!浙工商、北大等提出相关反馈的视频时序定位新任务

下午11时 2025/01/02 作者 PaperWeekly

概览:
本文介绍一篇 NeurIPS 2024 的工作,提出了一种新的视频时序定位扩展任务。传统的视

分类 大模型、 学术 标签 paperweekly.site、 投稿说明、 文章内容、 最新论文解读、 科研心得、 竞赛经验 发表评论

2025年 AGI AI AI技术 Anthropic ChatGPT Claude DeepSeek DeepSeek-R1 DeepSeek R1 GitHub GPT-4o LLM Manus Meta OpenAI Python Sam Altman 人工智能 人形机器人 具身智能 大型语言模型 大模型 大语言模型 字节跳动 开源 强化学习 微软 扩散模型 技术创新 智能体 木易 机器学习 深度学习 清华大学 生成式AI 用户体验 百度 腾讯 自然语言处理 英伟达 谷歌 阿里云 阿里巴巴 马斯克

近期文章

  • 从打分器到思考者:RM-R1用推理重塑模型价值判断
  • SSM+扩散模型,竟造出一种全新的「视频世界模型」
  • 250美元起售,还开源,Hugging Face 发布史上最亲民人形机器人
  • 一周两破18年数学纪录!陶哲轩惊叹:AlphaEvolve带来久违「加速度」
  • 大模型推理的“左右脑”革命!华为盘古Embedded凭昇腾之力,让快慢思考合二为一

分类

  • 分享
  • 国际
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 资讯
2025 年 6 月
一 二 三 四 五 六 日
 1
2345678
9101112131415
16171819202122
23242526272829
30  
« 5 月    

归档

  • 2025 年 5 月
  • 2025 年 4 月
  • 2025 年 3 月
  • 2025 年 2 月
  • 2025 年 1 月
  • 2024 年 12 月
  • 2024 年 11 月

AI新闻 | X平台 | APK反编译 | 京ICP备2024096144号 |
© 2025 每时AI • Built with GeneratePress
 下载我们的APP,AI秒送达!  立即下载
×