大模型推理归档

InftyThink：浙大联合北大打造的无限深度推理范式，突破大模型长推理瓶颈

2025年6月24日14时作者小兵的AI视界

浙江大学和北京大学联合推出InftyThink模型，通过分段迭代推理和中间总结突破传统长推理任务限制，显著降低计算复杂度并保持推理准确性和效率。

2025年6月6日23时作者机器之心

疏计算优势，成为大模型推理提效的关键路径。
华为团队重磅推出昇腾平台原生设计的 Pangu Pro

2025年3月19日8时作者 AIGC开放社区

专注于AIGC领域的专业社区报道了焱融科技YRCloudFile支持大模型推理场景的KVCache特性，显著提升推理性能和效率。

2025年3月7日16时作者 AI前线

春节期间DeepSeek引起广泛关注，AWS宣布开源DeepSeek模型。AICon大会聚焦AI应用边界，涵盖端侧智能、多模态大模型创新实践等议题。

2025年2月27日16时作者甲子光年

趋境科技通过 ‘以存换算’ 和全系统异构协同优化技术，成功突破了千亿参数模型落地过程中的成本高企与性能折损问题。该公司完成了数千万元天使轮融资，并推出软硬一体工作站降低大模型部署门槛。

2025年2月14日8时作者 NLP工程化

基于层次化强化学习，ReasonFlux 提出一种更高效且通用的大模型推理范式，核心在于结构化的思维模板，结合层次化推理和强可解释性，仅 32B 参数，使用 8 块 NVIDIA A100-PCIE-80GB GPU，能通过自动扩展思维模板提升推理能力。