资讯
国际
分享
大模型
学术
开源
机器人
关于我们

PaperAgent

仅499页！吃透大语言大模型

下午7时 2025/05/20 作者 PaperAgent

《自然语言处理：大模型理论实践》一书涵盖基础理论到高级应用的全方位内容，引导读者从统计方法走向大模型研究。介绍了近年来生成式预训练对话人工智能技术取得的重大进展，强调了创新对科研的重要性，并提供了一套学术辅导和论文指导服务。

分类分享标签 QS前50校、 SCI二区、大语言模型、生成式预训练、研0小白、自然语言处理发表评论

首次全面复盘AI Agents记忆系统：3大类，6种操作！

下午2时 2025/05/17 作者 PaperAgent

：
参数化记忆、上下文结构化记忆和上下文非结构化记忆
，并介绍了
六种
基本的记忆操作：
巩固、更新

分类分享标签 AI记忆机制、 Multi-Agent系统、动态学习、单智能体、多模态Agent、跨文本整合发表评论

字节跳动Seed1.5-VL复杂图表精准抽取，Deep Think是多模态未来的主流

下午7时 2025/05/16 作者 PaperAgent

Seed1.5-VL 是一个由 ByteDance 开发的多模态语言模型，在处理复杂表格、模糊图片和几何题目等方面表现出色。其架构包含视觉编码器和MoE LLM。预训练数据包括3万亿高质量token，遵循幂律和对数线性关系。Seed1.5-VL 在Hugging Face上可用体验，并通过强化学习后处理提升性能。

分类分享标签 20B 参数、 3万亿、 ByteDance、 Seed1.5-VL、大型语言模型、视觉编码器发表评论

Hugging Face刚刚开源了一个MCP全面指南~

下午2时 2025/05/16 作者 PaperAgent

Hugging Face 发布了 MCP 课程，涵盖 MCP 概念、使用方法和实际问题解决等内容，该课程完全免费且开源。

分类分享标签 Hugging Face、 MCP课程、减少维护负担、标准化接口、模型上下文协议、简化集成过程发表评论

阿里Qwen3技术报告核心要点解读！

下午2时 2025/05/15 作者 PaperAgent

阿里Qwen3技术报告发布，涵盖密集和混合专家模型架构及预训练细节，包括大规模语言数据、多领域知识学习等。

分类分享标签 4,096 tokens、 5万亿、 Qwen、三阶段预训练、密集模型架构、混合专家模型架构发表评论

火爆全网！《LLM书》.PDF

下午2时 2025/05/13 作者 PaperAgent

本书介绍生成式人工智能项目生命周期，涵盖模型选择、微调和部署等内容。通过直观示例和技术库指导读者掌握Transformer和Diffusers等工具。同时介绍了大模型前沿课程、顶会论文idea以及学术辅导服务。

分类分享标签 Diffusers、 Tingberg老师、 Transformer、中稿案例、大模型前沿系列课、顶刊审稿人发表评论

75页哈工大多模态推理大模型最新综述：感知、推理、思考与规划

下午7时 2025/05/12 作者 PaperAgent

大语言多模态推理模型研究综述提出四阶段发展路线图：感知驱动模块化推理、以语言为中心短推理、长推理及原生多模态推理模型。

分类分享标签 Chengyi Wang、 Jiaxuan Liu、 Microsoft Research Asia、 Tsinghua University、 Weirong Zhang、 Xinyu Zhuang 发表评论

14B检索能力超过Google Search，阿里ZeroSearch通过RL激发LLM检索推理能力~

下午2时 2025/05/11 作者 PaperAgent

阿里通义Lab提出的ZEROSEARCH是首个无需与真实搜索引擎交互的强化学习框架，旨在激励语言模型提升搜索能力。

分类分享标签 14B检索模块、 7B检索模块、强化学习 (RL)、监督微调、课程式训练策略、阿里通义Lab 发表评论

一篇Multi-Agent具身智能技术最新综述

下午2时 2025/05/10 作者 PaperAgent

具身AI研究涵盖了单智能体和多智能体系统，并介绍了不同方法在控制、学习和生成模型中的应用。重点讨论了MAS的控制与规划、学习以及基于生成模型的交互机制。

分类分享标签具身AI、北理工、南京大学、复杂性挑战、样本效率、西安交通大学发表评论

WebThinker：一个边思考、边搜索、边写作的深度研究智能体

下午2时 2025/05/08 作者 PaperAgent

依赖静态的内部知识，在面对复杂、知识密集型任务以及需要综合多样网络信息生成全面研究报告时常显不足。为

分类分享标签 GPT、 WebThinker、强化学习、深度研究系统、生成科学研究报告、网页探索器发表评论

← 上一页页面1 页面2 页面3 页面4 … 页面23 下一页 →

搜索

2025年 AGI AI AI技术 Anthropic ChatGPT Claude DeepSeek DeepSeek-R1 DeepSeek R1 GitHub GPT-4o LLM Manus Meta OpenAI Python Sam Altman 人工智能人形机器人具身智能大型语言模型大模型大语言模型字节跳动开源强化学习微软扩散模型技术创新智能体木易机器学习深度学习清华大学生成式AI 用户体验百度腾讯自然语言处理英伟达谷歌阿里云阿里巴巴马斯克

近期文章

干货满满！图灵奖学术大牛和宇树、智谱等明星AI企业齐聚，探讨AI产业新风向
“AGI 五年内或将实现”：AI 教父 Bengio 呼吁中美达成共识，警惕 AI 沦为人类武器
深夜突袭！谷歌Gemini 2.5 Pro更新蝉联榜一：推理超越o3，编程超越opus4
强化学习之父Richard Sutton：人类数据耗尽，AI正在进入“经验时代”！
免费约饭！美国CVPR 2025，相聚人才晚宴

分类

分享
国际
大模型
学术
开源
机器人
资讯

2025 年 6 月
一	二	三	四	五	六	日
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30

« 5 月

归档

2025 年 6 月
2025 年 5 月
2025 年 4 月
2025 年 3 月
2025 年 2 月
2025 年 1 月
2024 年 12 月
2024 年 11 月

AI新闻 | X平台｜ APK反编译｜京ICP备2024096144号｜

© 2025 每时AI • Built with GeneratePress

下载我们的APP，AI秒送达！立即下载

×