日期: 2025 年 1 月 12 日
树莓派上都能运行的最强视觉小模型Moondream迎来更新,目光检测成为最大亮点
Moondream视觉语言模型更新发布两个版本:2B和0.5B,0.5B是全球最小的视觉语言模型。支持多种格式输出、OCR文本识别能力优化、引入目光检测技术等四大关键更新,尤其在自动驾驶、零售分析等领域具有巨大潜力。
史上最快,英伟达Sana模型安装和使用
英伟达联合清华大学和麻省理工开发的Sana AI绘画大模型,在4090显卡上可实现不到一秒出高清图的效果。它在中国开发者中表现出色,有望降低大规模应用的成本。文章介绍了如何安装和使用该模型,并附有工作流下载链接。