MI300X归档 - 每时AI

AMD GPU性能暴涨7倍，优化算法首次开源！高效MoE支持任意专家数量

2025年4月3日16时作者新智元

PERT_NUMBER==256），并积极利用共享内存（5kB LDS）和寄存器（52 VGPRs，

2025年3月25日16时作者量子位

AMD MI300X在FP8下全面超越英伟达H200，吞吐量最高可达H200的5倍。得益于SGLang框架和优化的AI内核库AITER，MI300X在延迟相似的情况下实现了更高的吞吐量，并且在固定并发情况下性能提升75%。

2025年3月19日8时作者 AIGC开放社区

AMD开源了最新小参数模型Instella-3B及其微调版本。该模型性能超越Llama-3.2-3B和Gemma-2-2B，并在多个基准测试中表现优异。