MMLU 归档 - 每时AI

Unsloth 发布了 Dynamic v2.0 量化

2025年4月26日8时作者 NLP工程化

Unsloth发布Dynamic v2.0量化版本，在MMLU和KL Divergence上表现更好，并修复了Llama.cpp中的问题，同时推出了新量化版本DeepSeek-R1/DeepSeek-V3-0324。

2025年4月12日11时作者硅星人Pro

发布，但已发布的Qwen系列含金量还在上升。
2个月前，李飞飞团队基于Qwen2.5-32B-Ins

2025年3月14日12时作者 HyperAI超神经

，再次刷新行业对开源大模型的认知。该模型在代码生成、多轮对话等任务中展现出了卓越的表现，推理能力更是

2025年3月3日16时作者量子位

来自华为、港大、KAUST和马普所的研究者提出了一种新的稀疏注意力机制——SepLLM，它通过根据原生语义动态划分token数量来显著减少KV缓存使用量，并在免训练、预训练和后训练场景下实现了50%以上的KV缓存减少。

2025年2月26日23时作者开源AI项目落地

英伟达推出DeepSeek R1在Blackwell架构上的优化，其推理性能提升了25倍，成本降低了20倍。通过使用FP4精度，DeepSeek-R1实现了更低的成本和更高的效率，可能带动API价格大幅下降。

2024年12月29日14时作者新智元

新智元报道
编辑：编辑部
【新智元导读】
谷歌CEO劈柴在年度战略会议上放出狠话，2025年将是AI