Python项目排行 | 6个
1. allenai / olmocr
-
项目语言: Python -
Star总数: 4,193 -
Fork总数: 250 -
Star新增: 1,329 stars today -
项目地址:
https://github.com/allenai/olmocr
一句话简介:olmOCR是一个用于将PDF文档线性化以构建LLM数据集和训练的语言模型工具包,支持大规模PDF处理、多节点集群运行和基本文本过滤等功能。

2. Soulter / AstrBot
-
项目语言: Python -
Star总数: 4,291 -
Fork总数: 244 -
Star新增: 397 stars today -
项目地址:
https://github.com/Soulter/AstrBot
一句话简介:AstrBot 是一个易上手的多平台 LLM 聊天机器人及开发框架,支持多种消息平台(如 QQ、微信、Telegram 等)和大语言模型(如 OpenAI、Gemini、Llama 等),具备可视化面板、插件开发、代码执行器等功能,可一键部署。
3. landing-ai / vision-agent
-
项目语言: Python -
Star总数: 3,313 -
Fork总数: 372 -
Star新增: 116 stars today -
项目地址:
https://github.com/landing-ai/vision-agent
一句话简介:VisionAgent是一个利用代理框架生成代码以解决视觉任务的库,支持多种LLM提供商,并提供文档和示例帮助用户快速上手。
4. freddyaboulton / fastrtc
-
项目语言: Python -
Star总数: 1,335 -
Fork总数: 115 -
Star新增: 391 stars today -
项目地址:
https://github.com/freddyaboulton/fastrtc
一句话简介:FastRTC是一个Python实时通信库,可将Python函数转换为通过WebRTC或WebSockets传输的实时音频和视频流,支持自动语音检测、转接、自动生成UI等功能,适用于开发实时语音和视频交互应用。
5. modelscope / DiffSynth-Studio
-
项目语言: Python -
Star总数: 7,382 -
Fork总数: 663 -
Star新增: 269 stars today -
项目地址:
https://github.com/modelscope/DiffSynth-Studio
一句话简介:DiffSynth-Studio 是一个扩散模型引擎,支持多种视频和图像合成模型,提供高效计算性能和丰富功能,适用于视频生成、图像编辑等任务。
6. hiyouga / LLaMA-Factory
-
项目语言: Python -
Star总数: 42,532 -
Fork总数: 5,195 -
Star新增: 188 stars today -
项目地址:
https://github.com/hiyouga/LLaMA-Factory
一句话简介:LLaMA-Factory 是一个支持零代码 CLI 和 Web UI 的工具,可轻松微调 100 多种大型语言模型和视觉语言模型,提供多种训练方法、高效算法和丰富的实验监控功能,广泛应用于多轮对话、工具调用、图像理解等任务。
(文:AIGC创想者)