上下文长度归档

《如何构建你的 Agent ：11 种提示技巧打造更优 AI agents》

上午8时 2025/05/25 作者 NLP工程化

文章介绍了Agent的prompt组成及其提示工程技巧，强调上下文的重要性、保持一致性、彻底性，并注意避免示例过拟合和利用工具调用限制等策略。

下午11时 2025/05/15 作者机器之心

在 ICML，NeurIPS，ICLR 等顶级会议上发表过论文。
本文提出一个
交替
「推理 – 擦

下午4时 2025/05/13 作者 PaperWeekly

OmniKV 提出了一种创新性的动态上下文选择方法，用于高效处理长上下文 LLM 推理。它无需丢弃任何 Token，通过动态选择实现计算稀疏，显著提升推理速度和吞吐量，且在各种预算下均优于丢弃 Token 的方法。

下午4时 2025/02/28 作者机器之心

近日，谷歌发布了一项高难度基准BIG-Bench Extra Hard（BBEH），旨在评估AI模型的高阶推理能力。该基准包含了23个任务，并将每个任务替换为更难的任务，覆盖更多方面的技能需求。如o3-mini (high)得分为44.8分不及格，而其它模型得分不超过10分。

下午4时 2025/02/19 作者智东西

智东西2月19日报道，在DeepSeek公布最新稀疏注意力框架NSA论文的5小时后，“大模型六小虎”

下午11时 2025/02/14 作者 Founder Park

火山引擎专家分享R1模型部署经验，讨论企业如何更好使用大模型，并预告2月20日Workshop。

下午12时 2025/02/07 作者 APPSO

春节期间DeepSeek大放异彩，华为将其集成到智能手机，性能有待提升。对比官方应用和ChatGPT，其在道德伦理、逻辑数学方面表现一般，在中文写作任务中表现出色但口语化不足。上下文长度及回答准确性仍需优化。

下午4时 2025/02/05 作者 PaperWeekly