跳至内容
每时AI

每时AI

  • 资讯
  • 国际
  • 分享
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 关于我们

机器之心

OpenAI 12连发第2弹:强化微调,少量样本就能训练自己的专家模型

下午1时 2024/12/07 作者 机器之心

OpenAI 发布了强化微调技术,允许开发者使用强化学习针对具体任务对模型进行进一步的微调,并根据提供的参考答案对模型的响应进行评分。这种技术能提高其在特定领域上的C2任务上的准确性,并增强模型对类似问题的推理能力。

分类 学术、 资讯 发表评论

突破!自然语言强化学习(NLRL):一个可处理语言反馈的强化学习框架

下午1时 2024/12/07 作者 机器之心

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000

分类 学术、 资讯 标签 0.85准确率、 NLRL框架、 复杂迷宫导航、 完整Actor-Critic系统、 突破棋环境、 自然语言策略迭代 发表评论

LeCun团队新作:在世界模型中导航

下午1时 2024/12/07 作者 机器之心

机器之心报道
机器之心编辑部
现实世界版的 Genie-2?
最近,世界模型(World Model

分类 学术、 资讯 标签 NWM、 SOTA、 导航世界模型、 目标导向导航、 视频密西根大学、 视频预测 发表评论

用LLaVA解读数万神经元,大模型竟然自己打开了多模态智能黑盒

下午1时 2024/12/07 作者 机器之心

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000

分类 学术、 资讯 标签 低层级感知神经元、 刺激神经元、 多模态语言模型、 幻觉现象、 情感与共情神经元、 物体神经元 发表评论

刚刚,2025 IEEE Fellow名单出炉:戴琼海、姜大昕、尹首一、翟广涛、褚晓文等人入选

下午1时 2024/12/07 作者 机器之心

机器之心报道
机器之心编辑部
刚刚,美国电子电气工程师学会(Institute of Electri

分类 学术、 资讯 标签 IEEE Fellow、 杰出贡献、 每年评选、 电气与电子工程师协会、 计算机科学、 顶级学术和职业成就 发表评论

OpenAI 12连更第一弹:o1完全体,200刀一个月的ChatGPT Pro

上午4时 2024/12/06 作者 机器之心

机器之心报道
机器之心编辑部
一天前,OpenAI 官方 X 账户的一条推文将 AI 社区的期待值拉

分类 学术、 资讯 标签 200美元、 ChatGPT Pro、 o1推理模型、 医学研究人员、 数学任务、 高级用户 发表评论

GAN作者追忆往事:论文是DDL前一周开始写的,最初在NeurIPS大会无人问津

下午1时 2024/12/05 作者 机器之心

NeurIPS颁发时间检验奖给Ian Goodfellow的GAN论文,GAN自提出十年内引用超8.5万次。作者Sherjil Ozair回忆了GAN诞生过程及人工智能在过去十年的发展。

分类 学术、 资讯 标签 Ian Goodfellow、 Ilya Sutskever、 学术界、 时间检验奖、 生成对抗网络(GAN)、 蒙特利尔大学 发表评论

NeurIPS Spotlight|从分类到生成:无训练的可控扩散生成

上午11时 2024/12/05 作者 机器之心

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000

分类 学术、 资讯 标签 TFG、 分子属性优化、 多目标条件生成、 细粒度标签生成、 统一理论基础、 递归增强 发表评论

推动大模型自我进化,北理工推出「流星雨计划」

上午11时 2024/12/05 作者 机器之心

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000

分类 学术、 资讯 标签 Meteor、 导师监督学习、 强化学习、 自适应推理策略、 迭代式自我评估、 领域数据蒸馏 发表评论

谷歌世界模型爆发:单张图生成可玩3D世界,还要和马斯克一起做AI游戏

上午11时 2024/12/05 作者 机器之心

机器之心报道
机器之心编辑部
昨晚,世界模型向前迈出了一大步!
Google DeepMind 震撼

分类 学术、 资讯 标签 Auto-Regressive Potential Diffusion Models、 Genie 2、 World Model、 天气预测、 智能体研究、 环境生成与探索 发表评论
较早文章
较新文章
← 上一页 页面1 … 页面96 页面97 页面98 … 页面105 下一页 →

2025年 AGI AI AI技术 Anthropic ChatGPT Claude DeepSeek DeepSeek-R1 DeepSeek R1 GitHub GPT-4o LLM Manus Meta OpenAI Python Sam Altman 人工智能 人形机器人 具身智能 大型语言模型 大模型 大语言模型 字节跳动 开源 强化学习 微软 扩散模型 技术创新 智能体 木易 机器学习 深度学习 清华大学 生成式AI 用户体验 百度 腾讯 自然语言处理 英伟达 谷歌 阿里云 阿里巴巴 马斯克

近期文章

  • 时隔一年,再次使用7个国产AI大模型写高考作文,国产模型的进步也太大了!有彩蛋。
  • 小红书开源大模型dots.llm1,初次出手,小有惊艳!国外网友们又炸了……
  • 18天光速打脸!OpenAI刚夸TypeScript最合适,转头就用Rust重写Codex CLI
  • 别被MCP的包装骗了!重构系统、向智能体转型,CEO亲述:关键时刻还是RPA兜底?
  • 你永远叫不醒装睡的大模型!多轮对话全军覆没,性能暴跌39%

分类

  • 分享
  • 国际
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 资讯
2025 年 6 月
一 二 三 四 五 六 日
 1
2345678
9101112131415
16171819202122
23242526272829
30  
« 5 月    

归档

  • 2025 年 6 月
  • 2025 年 5 月
  • 2025 年 4 月
  • 2025 年 3 月
  • 2025 年 2 月
  • 2025 年 1 月
  • 2024 年 12 月
  • 2024 年 11 月

AI新闻 | X平台 | APK反编译 | 京ICP备2024096144号 |
© 2025 每时AI • Built with GeneratePress
 下载我们的APP,AI秒送达!  立即下载
×