显著降低归档

LLM的“记忆外挂”来了！Supermemory新API：一行代码让LLM记忆“无限+省钱90%”

下午11时 2025/05/16 作者 AI寒武纪

超级记忆公司发布Infinite Chat API，能为任何大模型扩展上下文长度，解决其处理长文本时的失忆问题。

下午12时 2025/03/10 作者量子位

量子位报道：Zoom团队提出新方法‘草稿链’显著降低推理任务的延迟和成本，同时保持高准确率。通过为每个推理步骤生成简洁的中间结果，节省80%-90%的token使用量，并有望帮助企业每月节约数干美元成本。相关代码已开源。

上午8时 2025/01/22 作者 NLP工程化

VITA-1.5 提升视频-语音交互速度，端到端语音交互时延从约4秒降低至1.5秒。