Hugging Face 归档

huggingface发布了3B参数里的SoTA模型 smollm3

2025年7月10日8时作者 NLP工程化

Hugging Face 发布了3B参数的SOTA模型 Smollm3，支持Think/No-Think模式，默认不支持汉语，未来将发布其详细信息及构建方法。

OCRFlux-3B：PDF转Markdown

2025年7月5日8时作者 NLP工程化

PDF转Markdown工具OCRFlux-3B效果不错，支持在线使用和下载模型。

李彦宏出手！百度大模型终于开源

2025年6月30日16时作者智东西

百度开源文心大模型4.5系列10款模型，涵盖多种参数规模的混合专家和稠密型模型。该系列模型在文本和多模态基准测试中达到SOTA水平，支持跨硬件平台部署。

人人皆可创作音乐！腾讯AI Lab开源音乐生成大模型SongGeneration

2025年6月20日16时作者机器之心

解决音乐 AIGC 中
音质、音乐性与生成速度
这三大共性难题，基于 LLM-DiT 的融合架构，模

SmolVLA：Hugging Face 开源的轻量级 VLA 模型，体积小 10 倍，性能却达 SOTA！

2025年6月19日14时作者小兵的AI视界

SmolVLA 是 Hugging Face 开源的一个轻量级视觉-语言-行动模型，专为经济高效的机器人设计。它拥有4.5亿参数，能够在消费级GPU甚至CPU上运行，支持在MacBook等设备上部署。通过多模态输入处理、高效推理和异步执行特性，在物体抓取与放置、家务劳动和货物搬运等多种应用场景中表现出色。