可基于任何内容创建的 AI 问答助手Gurubase
Gurubase 是一个开源 RAG 系统,支持通过网页、PDF、视频和 GitHub 仓库创建 AI 驱动的问答助手(’Gurus’)。它允许嵌入网站提问,并提供实时更新等功能。
Gurubase 是一个开源 RAG 系统,支持通过网页、PDF、视频和 GitHub 仓库创建 AI 驱动的问答助手(’Gurus’)。它允许嵌入网站提问,并提供实时更新等功能。
IBM Research 的 SmolDocling-256M-preview 是一个多模态文档处理模型,专注于将图像文档转换为结构化文本,并支持 OCR、代码块识别、数学公式转换和表格/图表解析等。其核心特性包括高效处理和精准元素识别,具备轻量级模型(基于 2.56 亿参数的 Idefics3 架构)以及开源协议。
通过模型上下文协议(MCP),AbletonMCP 将 Ableton Live 与 Claude AI 连接,实现音乐制作、曲目创建和现场会话操作。该系统包括两个主要组件:Ableton Remote Script 和 MCP 服务器。
一款高颜值第三方网易云播放器VutronMusic,支持本地歌曲、离线歌单播放及读取封面和歌词功能。项目使用Vue3+ts+pinia+fastify+better-sqlite3开发,兼容Mac状态栏歌词、Linux TopBar歌词显示,并提供云盘与评论功能。
OWL 是一个多智能体协作框架,支持在线搜索、多模态处理、浏览器操作和文件解析等核心功能,并提供丰富的工具包。支持多种安装方式,包括使用 uv 和 venv/pip/conda 安装,以及通过 Docker 运行。项目文档详尽,便于用户快速上手。
基于多模态大语言模型的PDF转Markdown工具,支持任意PDF文档转换为结构清晰的Markdown格式,并完整保留排版、表格等元素。