AWQ:模型量化应当关注激活值

这篇文章介绍了AWQ(activation-aware weight quantization),一种用于模型量化的新方法。通过保留0.1%的参数不进行量化可以显著提高PPL性能,但混合精度系统实现较为困难。AWQ在边缘设备使用中表现优异,并且需要更小和鲁棒性的校准数据集。

把动漫带到现实,我用AI跟童年的主角们拍了张会动的大合照

最近几天常用生图工具Whisk生成的图片效果令人惊喜。通过两张参考图片,可以轻松实现复杂的构想。使用Whisk能大幅降低创意绘画门槛,用户无需详细描述人物长相、穿着和背景环境,只需上传主题图片和风格图片即可。