InftyThink:浙大联合北大打造的无限深度推理范式,突破大模型长推理瓶颈
浙江大学和北京大学联合推出InftyThink模型,通过分段迭代推理和中间总结突破传统长推理任务限制,显著降低计算复杂度并保持推理准确性和效率。
浙江大学和北京大学联合推出InftyThink模型,通过分段迭代推理和中间总结突破传统长推理任务限制,显著降低计算复杂度并保持推理准确性和效率。
专注于AIGC领域的专业社区报道了焱融科技YRCloudFile支持大模型推理场景的KVCache特性,显著提升推理性能和效率。
春节期间DeepSeek引起广泛关注,AWS宣布开源DeepSeek模型。AICon大会聚焦AI应用边界,涵盖端侧智能、多模态大模型创新实践等议题。
趋境科技通过 ‘以存换算’ 和全系统异构协同优化技术,成功突破了千亿参数模型落地过程中的成本高企与性能折损问题。该公司完成了数千万元天使轮融资,并推出软硬一体工作站降低大模型部署门槛。
基于层次化强化学习,ReasonFlux 提出一种更高效且通用的大模型推理范式,核心在于结构化的思维模板,结合层次化推理和强可解释性,仅 32B 参数,使用 8 块 NVIDIA A100-PCIE-80GB GPU,能通过自动扩展思维模板提升推理能力。