资讯
国际
分享
大模型
学术
开源
机器人
关于我们

AI科技大本营

告别传统强化学习？上下文强化学习基座模型 OmniRL 让 AI “自学成才”

2025年2月11日23时作者 AI科技大本营

近日，香港中文大学AIRS团队提出OmniRL模型，通过大规模元训练和上下文强化学习方法解决AI泛化能力问题，实现从‘环境适应’走向‘能力泛化’的突破。

分类分享标签 AI 大模型、 AIRS、上下文强化学习、元训练策略、通用性、香港中文大学发表评论

十道灵魂之问，十日谈解读 DeepSeek 的“国运级创新”！

2025年2月11日23时作者 AI科技大本营

eepSeek 炸醒了沉寂已久的 AI 圈。这个“低成本”、“高性能”、“真开源”的国产大模型，不仅

分类分享标签 AI技术、 CSDN高级副总裁、 DeepSeek、智能化转型、李建忠、软件开发发表评论

张俊林从Deepseek R1看Scaling Law的未来

2025年2月10日12时作者 AI科技大本营

续是推动大模型快速发展的第一动力，我自己一般是通过它来对大模型未来发展悲观乐观做总体判断的，只要目前

分类分享标签大模型摩尔定律、张俊林、强化学习、智能增长曲线、逻辑推理、预训练阶段发表评论

刚刚，Sam Altman 给投资者们又打了一剂“定心针”

2025年2月10日8时作者 AI科技大本营

Sam Altman 在其个人博客发布文章《Three Observations》，提出关于AI经济学的三项观察：1.AI模型智能水平与训练资源呈对数关系；2.使用特定水平AI的成本每12个月下降约10倍；3.线性增长的智能将创造超指数级的社会经济价值。文中预测，未来AI Agent将能够胜任人类软件工程师工作。

分类分享标签 AGI 影响、 AI 经济学、 OpenAI、 Sam Altman、成本下降、模型智能水平发表评论

杨强院士领衔，2025 全球机器学习技术大会正式官宣！

2025年2月8日23时作者 AI科技大本营

AI 发展的传统壁垒，利用强化学习的自主探索能力，
AI 大模型从被动训练走向自主成长。
这一系列

分类分享标签 CTO、 ML Summit 2025、企业高管、多模态大模型、大语言模型、院士发表评论

AI 教父 Bengio：OpenAI 不会分享超级智能，而是会用它来搞垮其他人的经济

2025年2月8日23时作者 AI科技大本营

| 王启隆
出品丨AI 科技大本营（ID：rgznai100）
出处
丨
https://www.y

分类分享标签 AlphaFold、 Danielle Allen、 Erik Brynjolfsson、 Yoshua Bengio、治理框架、超级智能发表评论

直击 DeepSeek 技术真相，对我们究竟意味着什么？

2025年2月8日12时作者 AI科技大本营

DeepSeek V3 在两个月内迅速成为中国 AI 大模型的代表，并通过开源和亲民的价格策略赢得了广泛的关注。它采用强化学习技术，专注于“深度推理”，并以较低的成本提供了高效的 API 服务。

分类分享标签 2000万、 DeepSeek R1、刘知远、强化学学习、清华大学、知识蒸馏方法发表评论

50000 字纯对话 | 美国AI科学家x半导体专家，唠唠DeepSeek和未来的“赌国运”之战

2025年2月7日23时作者 AI科技大本营

xfridman.com/deepseek-dylan-patel-nathan-lambert
为

分类分享标签 DeepSeek R1、人机融合、伦理挑战、强化学习、普世目标、范式转换发表评论

李建忠：DeepSeek 关键技术创新及对 AI 生态的影响

2025年2月6日16时作者 AI科技大本营

【导读】
全球 AI 竞赛正酣，DeepSeek 的出现，宛如一石激水，打破了原有的平静。作为资深技

分类分享标签 DeepSeek、 MIT许可、 MLA、 MoE、后训练强化学习、经典Transformer 发表评论

刘知远：DeepSeek 的大胜，揭示了 OpenAI 的傲慢之罪

2025年2月5日23时作者 AI科技大本营

【CSDN 编者按】
近年来，大模型技术已经成为全球科技领域的焦点。从 ChatGPT 到各种新兴的

分类分享标签库兹韦尔、施密特、杨立昆、科技延长寿命、统治欲望、能源储备 1 条评论

← 上一页页面1 … 页面14 页面15 页面16 … 页面19 下一页 →

搜索

AGI AI AI技术 Anthropic ChatGPT Claude DeepSeek DeepSeek-R1 DeepSeek R1 GitHub GPT-4o LLM Meta OpenAI Python Sam Altman 人工智能人形机器人具身智能多模态大型语言模型大模型大语言模型字节跳动工业机器人开源强化学习微软扩散模型技术创新智能体木易机器学习深度学习清华大学生成式AI 用户体验百度腾讯自然语言处理英伟达谷歌阿里云阿里巴巴马斯克

分类

分享
国际
大模型
学术
开源
机器人
资讯

Long-RL：让强化学习应对超长序列任务的全新框架
GenAI Processors：为生成式AI打造的轻量级、高效并行内容处理库
lmpo：一个简洁易懂的语言模型策略优化GitHub项目
WebMCP：让AI助手与网页应用无缝交互的创新解决方案
MIRIX：你的专属多Agent个人助手，通过屏幕观察和自然对话构建记忆

2025 年 7 月
一	二	三	四	五	六	日
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30	31

« 6 月

归档

2025 年 7 月
2025 年 6 月
2025 年 5 月
2025 年 4 月
2025 年 3 月
2025 年 2 月
2025 年 1 月
2024 年 12 月
2024 年 11 月

AI新闻 | X平台｜ APK反编译｜京ICP备2024096144号｜

© 2025 每时AI • Built with GeneratePress

下载我们的APP，AI秒送达！立即下载

×