这个扩散LLM太快了!没有「请稍后」,实测倍速于Gemini 2.5 Flash

Mercury 是一款专为聊天应用设计的扩散 LLM,其速度和效率显著提升,能够实现即时响应。Inception Labs 在 X 上宣布了这款新产品,它在性能测试中表现优异,接近 GPT-4.1 Nano 和 Claude 3.5 Haiku 等前沿模型。