开源本地化AI研究工具!彻底打通本地化智能研究工作流!
一款结合大语言模型和网络搜索功能的AI研究助手Local Deep Research,支持终端和网页界面使用,具备自动化深度研究、智能信息筛选及PDF导出等功能,强调隐私与效率并重。
一款结合大语言模型和网络搜索功能的AI研究助手Local Deep Research,支持终端和网页界面使用,具备自动化深度研究、智能信息筛选及PDF导出等功能,强调隐私与效率并重。
一款名为CSM的新开源TTS模型由Sesame最新发布,能够生成带有上下文情感、自然语气和音调变化的人工智能语音。它具有高保真效果、端到端Transformer生成能力、上下文理解以及实时语音生成等功能。
通过MCP-Playwright协议,大语言模型如Claude能够直接控制浏览器进行网页交互、数据抓取等任务。它支持点击按钮、填写表单、执行JavaScript代码等功能,并提供截屏和分析页面的能力。
Google开源Gemini 2.0多模态生图功能,用户只需一句话即可对图片进行修改或创作,如换发色、闭眼、改变对象身份等,展示了生成式AI在图像编辑领域的巨大进步。
一款标星22.6K的开源云盘系统Cloudreve支持多存储服务、离线下载、WebDAV访问等功能。它采用Go语言开发,提供React前端框架,并且有多种安装方式供用户选择。
一键生成完整故事视频的AI工具Story-Flicks,支持多种文本及图像生成模型和TTS服务。通过输入故事主题即可自动生成包含剧情、图片、音频和字幕的高清视频,极大地简化了短视频创作过程。
OWL 是目前最好的 Manus 开源复现版本,基于 CAMEL-AI 框架构建,支持多种功能如实时信息检索、多模态处理等,并提供了四种部署方式。
Nanobrowser 是一款开源的 AI 网页自动化工具,支持多智能体协作、任务自动化和多种大语言模型选择。它以用户为中心,功能强大且隐私友好,适用于电商监控、数据抓取、办公自动化等场景。