百页专业报告一次直出!Jürgen团队开源框架WriteHERE,重塑AI写作天花板


在 AI 长文写作领域,一项革命性突破正在改写行业规则 —— 由「人工智能之父」Jürgen Schmidhuber 领衔的团队,正式开源其长文写作框架 WriteHERE。该框架凭借异质递归规划(Heterogeneous Recursive Planning)技术,实现单次生成超 4 万字、100 页专业报告的能力,在小说创作、报告生成场景中全面超越 Perplexity 付费版「深度研究」、DeepMind 的 Agent’s Room 及斯坦福 STORM 等顶尖方案。



  • 论文标题:Beyond Outlining: Heterogeneous Recursive Planning for Adaptive Long-form Writing with Language Models

  • 论文地址:https://arxiv.org/pdf/2503.08275

  • 项目主页 & 在线 Demo:http://writehere.site/

  • GitHub 仓库:https://github.com/principia-ai/WriteHERE



动态规划颠覆传统

从「大纲先行」到「实时编织」


现有 AI 长文生成系统(如 Agent’s Room、STORM)多将写作简化为「规划 – 填充」的线性流程,而 WriteHERE 首次通过数学形式化揭示:长文写作本质上是检索(Retrieval)、推理(Reasoning)、写作(Composition)三类异构任务的动态编织


1. 写作代理系统的五元组定义


研究团队将写作系统抽象为数学元组:



其中:


  • :Agent 内核,负责任务调度与决策。

  • :内部记忆,存储大纲、草稿、检索结果。

  • :外部数据库,包括搜索引擎、参考文献。

  • :工作空间,承载文本生成与编辑。

  • :输入输出接口,连接用户与信息源。


这一形式化框架突破了传统 AI 写作工具「重生成、轻管理」的设计范式。写作不再是简单的文本扩展,而是记忆空间、工作空间与外部环境的持续交互过程


2. 任务类型的数学建模


研究团队将写作过程解构为三类原子操作:


  • 检索任务:针对信息需求,从环境获取知识更新记忆

  • 推理任务:基于知识解决推理问题,如逻辑校验、结构优化。

  • 写作任务:基于知识,在状态为的工作空间中生成满足目标的文本。


规划问题的形式化革命

从 HTN 到异质递归


研究团队受层次任务网络(HTN)规划启发,提出写作规划问题的数学定义:



  • 顶层写作任务:包含目标、初始工作空间状态、初始记忆内容

  • 原子任务集合:可执行的检索、推理、写作原子操作。


解决方案为满足以下条件的原始操作序列:


  • 可执行性:每个操作的前置条件均被满足。

  • 目标达成:最终工作空间状态符合写作目标。


核心技术

异质性递归与状态化 DAG 任务管理


WriteHERE 的核心突破体现在两大技术创新:


1. 异质任务递归分解:每个写作任务被动态标注类型(检索 / 推理 / 写作),并基于类型分解为子任务,直至可执行的原子任务。例如,当执行「撰写贸易报告第六章:行业深度剖析:识别赢家与输家」,系统进一步分解为以下子任务:


  • 检索任务:收集最新 (截至 2025 年 4 月) 的行业数据,包括科技 (半导体、软件、硬件)、汽车、农业、制药 / 医疗保健、能源和消费品行业的贸易统计、市场份额、公司财务表现、行业报告及专家评论。

  • 推理任务(8 个子任务):构建统一分析框架,确立「赢家」和「输家」识别标准;分别分析科技、汽车、农业、制药 / 医疗保健、能源和消费品行业的关税、非关税措施、宏观经济状况及全球价值链重构影响;规划行业绩效对比可视化内容。

  • 写作任务(8 个子任务):撰写章节引言;分别撰写科技、汽车、农业、制药 / 医疗保健、能源和消费品六大行业的详细分析;撰写章节结论,综合关键发现并过渡至下章区域视角。


2. 状态化层次调度算法:任务依赖关系以有向无环图(DAG)管理,结合任务状态(激活 / 挂起 / 静默)实现自适应执行。该机制确保系统能根据实时反馈动态调整规划深度,例如在贸易报告中,系统能追踪每个子任务的状态,确保在撰写特定章节(如区域分析)前完成其所有依赖任务(如宏观经济影响分析)。


实验表现

全面碾压现有方案


团队在小说创作(Tell me a story 数据集)和技术报告生成(WildSeek 数据集)两大任务中验证了 WriteHERE 的优越性:


  • 小说写作:基于 GPT-4o 和 Claude-3.5-Sonnet,WriteHERE 在情节结构、创意性、角色塑造等维度全面领先。当生成长度从 2000 词扩展至 8000 词时,其优势进一步扩大,整体胜率较 Agent’s Room 超过 90%(见图 1)。

  • 技术报告:在信息相关性、覆盖广度、深度等关键指标上,WriteHERE 以接近满分的表现(平均 4.9/5)超越 STORM 和 Co-STORM。对比移除异质递归规划模块的消融实验,性能显著下降,印证了该设计的核心价值(见图 2)。


图 1 小说写作任务评测


图 2 报告写作任务评测


压力测试

百页报告生成


研究团队公开的超 100 页《2025 年 Q2 全球贸易战深度报告》展现了框架的极致能力:


系统自动构建了一个包含 16 个主要章节、超过 80 个子任务的异质递归计划,涵盖引言、全球关税结构、非关税壁垒、宏观经济冲击、全球价值链重构、行业赢家与输家、地区分析、未来预测等内容。整个生成过程体现了异质递归规划的优势 —— 系统能够自动根据需要深入研究特定主题(如美国 232 条款钢铝关税扩张),同时保持对整体结构的把控,确保各章节之间的连贯性和一致性。最终报告包含超过 44,000 字的正文,覆盖从关税机制到行业赢家的全面分析。


开源生态与社区反响


作为完全开源(MIT 协议)的框架,WriteHERE 支持开发者自由调用异构 Agent(如专用检索模型、推理引擎),或将彻底改变长文写作工具的商业模式。


英伟达高级研究科学家 Enze Xie 试用后评价模型表现惊艳:



社区用户 @AIExplorer 反馈:


WriteHERE 太棒了。我把它和 GPT-4o-mini 一起使用,它能有效替代我的大部分 OpenAI 深度搜索。」



知名 AI 领域推特大 V Ben Tossell 更直言:


「这个写作模型太棒了。」



此刻,长文写作的「自动化天花板」已被打破。访问 writehere.site,即可加入这场 AI 写作的革命。


©

(文:机器之心)

发表评论

×

下载每时AI手机APP

 

和大家一起交流AI最新资讯!

立即前往