1.5B 归档 - 每时AI

推理成本比MoE直降83%！字节最新大模型架构入围ICLR 2025

2025年2月12日23时作者量子位

字节推出UltraMem稀疏模型架构，相比MoE和PKM架构，可实现高达83%的推理成本降低和2-6倍的推理速度提升。

2025年1月16日23时作者开源AI项目落地

在大数量级AI数据处理场景下，JinaAI的ReaderLM-v2语言模型通过将原始HTML转换为Markdown或JSON格式解决了资源消耗问题，并实现了更好的Markdown生成、新增JSON输出及更强的上下文和多语言支持。