智谱开源AI绘图CogView4,曾经的开源之光回来了。
昨天连更两篇,今天智谱发布CogView4开源模型,支持中英文文字生成和语义理解。模型已在AutoDL上测试完成,期待其在AI绘图领域的潜力应用。
昨天连更两篇,今天智谱发布CogView4开源模型,支持中英文文字生成和语义理解。模型已在AutoDL上测试完成,期待其在AI绘图领域的潜力应用。
DeepSeek AI 团队发布了 FlashMLA,针对 Hopper GPU 优化的 MLA 解码内核,支持 BF16 和分页 KV 缓存,实现高达 3000 GB/s 内存带宽和 580 TFLOPS 计算性能。
DeepSeek开源了FlashMLA,这是一个为Hopper GPU开发的高效MLA解码内核,已投入生产使用,支持BF16和分页KV缓存(块大小64),在H800上可实现高达580 TFLOPS的计算性能。
首个开源代码库FlashMLA针对英伟达Hopper架构GPU优化,支持BF16数据类型和分页KV缓存,提供高性能计算与内存吞吐,在内存限制配置下推理性能提升2-3倍,计算限制配置下提升约2倍。