专为 AI Agent和AI应用构建的开源浏览器自动化 API:steel-browser
Steel Browser 是一个开源浏览器自动化 API,支持 AI 应用和代理构建。它提供了 REST API 接口来控制浏览器操作,兼容 Docker,并且易于部署和使用。
Steel Browser 是一个开源浏览器自动化 API,支持 AI 应用和代理构建。它提供了 REST API 接口来控制浏览器操作,兼容 Docker,并且易于部署和使用。
E2M 是一个 Python 库,用于将多种文件格式(如 doc, docx, epub, html 等)转换为 Markdown 格式。通过解析器和转换器架构实现,支持包括 PDF、MP3、URL 在内的多种文件类型的处理,并提供 CLI 工具来加速转换过程。
Director是一个视频代理框架,用于处理复杂的视频任务;Clevrr Computer是通过PyAutoGUI实现高效系统操作;实时个性化推荐系统课程涵盖H&M时尚商品的推荐系统的构建与部署;RAGLite支持PostgreSQL和SQLite数据库的数据检索增强生成;sora提供分辨率高达1080p、功能丰富的视频转换工具,包括文本转视频、图像转视频等。
Auto_Jobs_Applier_AI_Agent是基于人工智能的求职助手,提升求职效率。Smart Composer 是一款Obsidian插件,帮助用户高效撰写内容。Image Background Remover in the Browser是一款去除图像背景的应用程序。ControlFlow是一个Python框架,用于构建智能工作流。O1-CODER结合强化学习和蒙特卡洛树搜索生成代码模型,旨在提升系统化推理能力。
AFFiNE 是一个开源、一体化的工作区和操作系统,支持维基、知识管理、演示和数字资产。它允许将任何构建块放在无边画布上,包括富文本、便签、嵌入式网页等,并配备多模式人工智能合作伙伴。
腾讯发布混元视频生成大模型HunyuanVideo,具备高清质感、运动流畅及多视角切换等功能,现已开源。该模型采用Transformer设计和MLLM文本编码器,并通过3D VAE进行压缩训练,支持多种重写模式以适应不同用户需求。
GenCast是一个基于扩散模型的中期天气预报工具,提供多个预训练模型及示例代码。TRELLIS是大型3D生成模型,支持多种格式的3D资产生成和灵活编辑。Report mAIstro是一款报告生成工具,利用LLM快速创建定制化报告。Qodo Cover 是一个测试用例自动生成工具,帮助提高代码覆盖率。OpenAI发布完整版O1模型及ChatGPT Pro订阅服务,包括多模态输入支持、处理速度快等特性。