开源
字节开源多模态复杂文档解析模型!Dolphin:页面与元素并行解析,精准解析复杂文档!
字节跳动开源多模态AI模型Dolphin,通过两阶段机制精准解析复杂文档,支持页面级和元素级解析,并提供在线Demo及本地部署指南。
让 AI 图像处理变得简单而强大Gemini Image App,现代化的全栈 AI 图像处理平台
集成了 Google Gemini、OpenCV 和 YOLO 等先进技术,提供图像问答、生成、编辑
10.6k星星,开源热榜第一!完全本地化的免费Manus AI智能体,你只需要按时交电费。
AgenticSeek 是一个完全本地化的 AI 助手项目,替代 Manus AI。它具有智能网页浏览、自主编码等功能,并能自动分配最佳代理完成任务。
SketchVideo:手残党福音!草图秒变大片,快手黑科技让创作效率飙升300%
本文介绍了一个基于草图和文本提示的创新项目SketchVideo,它通过高效的视频生成与编辑框架改变了传统视频制作方式。该项目结合了多种先进技术,实现了高质量、连贯的视频生成和精细编辑,适用于影视制作、教育、游戏开发等多领域。
参加 Hugging Face 组织的 Gradio & MCP 智能体主题黑客松
欢迎参加Gradio & MCP智能体主题黑客松,Hugging Face举办全球线上活动,探索AnthropicMCP和AI Agentic系统。$10,000现金奖励等你来拿。
完全开源低成本的双足机器人
Unitree Qmini是一款完全开源低成本双足机器人,可个人用户进行3D打印制作。它专为爱好者、教育工作者和研究人员设计,提供模块化组装方式,加速创新并推动全球机器人生态系统发展。