每日AI新工具，作者每时AI

腾讯开源多模态扩散Transformer模型HunyuanVideo-Avatar，DeepSeek开源R1最新版本性能接近O3

上午11时 2025/05/29 作者每日AI新工具

HunyuanVideo-Avatar生成多角色对话视频；Paper2Poster自动生成科研海报并评估其质量；Chatterbox TTS提供情感控制的TTS模型；日本语文章解析器支持文本分析、OCR和语音朗读功能；syftr优化代理工作流程以达到准确性和成本之间的平衡。

Mac上的AI聊天侧边栏Onit，阿里巴巴开源QwenLong-L1，Web Agent 和浏览器之间无缝交互的标准框架

上午11时 2025/05/27 作者每日AI新工具

Onit是Mac上的AI聊天侧边栏，Cursor Chat的Mac版。Web Agent Protocol(WAP)用于实现用户、Web代理和浏览器之间的无缝交互。QwenLong-L1作为首个长文本推理大模型，在DocQA基准测试中表现出色。TranslateBookWithLLM是一个基于Ollama API的Python应用，支持大规模文本翻译，并提供Web和CLI界面。Claude Code MCP Server通过绕过权限限制增强了Claude的代码处理能力。

两款开源编程AI助手工具，又一款本地化Manus AI的替代方案

上午11时 2025/05/26 作者每日AI新工具

侧kick是一款基于CLI的开源AI工具，提供灵活的LLM选择和强大的agentic工作流。OpenCode是一个基于终端的强大AI助手，支持多种AI模型、会话管理和工具集成。AgenticSeek是完全本地化、注重隐私的AI助手。picoDeepResearch用于训练大型语言模型生成研究报告。Turbular为LLM提供统一API连接多种数据库。

GitHub Actions 工作流中运行 Claude Code，连接macOS Apple Notes的MCP服务器

上午11时 2025/05/23 作者每日AI新工具

本文介绍了多个AI相关的项目和工具，包括Claude Code Base Action、MMaDA、Pocket Flow Project Template、Notes MCP 和 KVoiceWalk。它们分别涵盖了代码生成、多模态扩散大语言模型、LLM项目模板、跨平台笔记服务及语音克隆等应用场景。

开源智能助手II-Agent，字节跳动开源的多模态基础模型BAGEL

上午11时 2025/05/22 作者每日AI新工具

II-Agent是开源智能助手，旨在简化跨领域工作流程。BAGEL是字节跳动的多模态基础模型，擅长图像理解、生成和编辑任务。Gmail AutoAuth MCP Server简化了Claude与Gmail的交互方式。AingDesk是一款简单易用的AI助手，支持知识库、模型API和智能代理等功能。Crawl4AI RAG MCP Server提供网页抓取和RAG能力，为AI代理和编码助手提供了高级功能。

后端服务器的Vibe Coding Agent，扩散模型的图像修复PixelHacker，Mem0的MCP服务器模板

上午11时 2025/05/21 作者每日AI新工具

AutoBE 是 AI 驱动的后端服务器代码生成工具，结合瀑布模型和螺旋模型。PixelHacker 是一种图像修复模型，采用潜在类别指导技术实现结构和语义一致性。MCP-Mem0 为 AI 代理提供长期记忆存储、检索和搜索功能。Agents Tools 提供一套统一且全面的构建、扩展和部署 AI Agent 的工具集。MCP Registry 是一个社区驱动的 MCP 服务器注册服务，用于发现和管理 MCP 实现及其元数据。

微软开源Magentic-UI协同解决复杂的Web任务，利用大型语言模型，自动生成学术论文的独立评审

上午11时 2025/05/20 作者每日AI新工具

Magentic-UI通过多智能体协作解决复杂Web任务；NLWeb简化网站对话式界面构建和自然语言交互；TypeAgent展示利用LLM构建个人代理架构的方法；AI Peer Review辅助学术论文同行评审生成元评审报告；AI看线提供基于历史数据的量化分析与走势预测工具。

录制用户操作简化RPA流程，实现浏览器自动化Workflow Use，DeepMind 的 AlphaEvolve 开源实现，

上午11时 2025/05/19 作者每日AI新工具

本文介绍了五款开源工具：Workflow Use简化RPA流程、OpenAlpha_Evolve利用进化算法发现自主算法、OpenManus无需邀请码即实现AI代理、BrowserBee结合LLM控制隐私优先的网页自动化任务，以及nanoDeepResearch从零构建ReAct智能体工作流。

无代码Agent构建平台，提取和总结ArXiv论文，并支持每日自动提取总结arxiv_summarizer

上午11时 2025/05/16 作者每日AI新工具

无代码Agent构建平台Open Agent Platform简化Agent管理；ArXiv Paper Summarizer利用Gemini API快速提取和总结arXiv论文；Simple Subtitling从音频文件生成带时间戳的字幕；Muscle Memory通过记录工具调用模式减少LLM使用，提高效率并降低成本；AutoGenLib使用OpenAI API动态生成代码实现按需导入模块和函数。

智能手机屏幕截图作为输入，能够自主执行用户指定的任务AgentCPM-GUI，简易的代理框架Minion Agent

上午11时 2025/05/14 作者每日AI新工具

AgentCPM-GUI 是由 THUNLP 和 ModelBest 联合开发的 GUI 智能体模型；Node.js Sandbox MCP Server 用于在 Docker 容器中运行 JavaScript 代码并动态安装 npm 依赖项；Scrapling 是高性能 Python 网页抓取库，具备自适应爬取和智能元素追踪功能；Minion Agent 支持浏览器操作、MCP 和自动工具注入等功能；Matrix-Game 是一个交互式世界基础模型，拥有170亿参数，能够生成高质量的游戏世界。

2025 年 5 月
一	二	三	四	五	六	日
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30	31