日期: 2025 年 5 月 21 日
谷歌发布最强 AI“全家桶”、一句话就让AI拍大片!这一夜,谷歌Gemini贯穿始终,网友:果然Android“靠边站”了
刚甩出“Windows 子系统”和“Copilot 开源”的重磅炸弹
,整个开发者圈还没从热议中缓过
AI若解决一切,我们为何而活?对话《未来之地》《超级智能》作者 Bostrom | AGI 技术 50 人
别策划
“ AGI 技术 50 人 ”访谈栏目
,挖掘 AI 背后的思考,激荡 AGI 的智慧,走近
Gemini 2.5 全系更新,Deep Think 加持碾压 OpenAI
Google 在 I/O 2025 大会发布了多项重要更新,包括 Gemini 2.5 全系更新、Gemma 3 系列的内存优化和 Imagen 4 的图像细节提升等。同时,Veo 3 支持视频与音频同时生成,Imagen 4 提升了写实和抽象风格图片处理能力,并集成至多个 Google 软件产品中。
无需 OCR 就能从各类文档中提取结构化信息的本地化开源工具docext
docext是无需OCR的新工具,用于从发票和护照等文档图像中提取结构化信息。它利用视觉语言模型准确识别并提取数据和表格信息。智能文档处理排行榜追踪和评估其在关键任务中的表现。
后端服务器的Vibe Coding Agent,扩散模型的图像修复PixelHacker,Mem0的MCP服务器模板
AutoBE 是 AI 驱动的后端服务器代码生成工具,结合瀑布模型和螺旋模型。PixelHacker 是一种图像修复模型,采用潜在类别指导技术实现结构和语义一致性。MCP-Mem0 为 AI 代理提供长期记忆存储、检索和搜索功能。Agents Tools 提供一套统一且全面的构建、扩展和部署 AI Agent 的工具集。MCP Registry 是一个社区驱动的 MCP 服务器注册服务,用于发现和管理 MCP 实现及其元数据。
自我进化的多智能体自动化系统EvoAgentX
酷是一款多智能体自动化系统EvoAgentX,适用于复杂AI场景如医疗诊断和电商订单处理。它能自动生成工作流并集成进化算法优化智能体行为与结构。文章还介绍了如何安装、配置和使用EvoAgentX进行任务生成及优化。
刚刚,Google 眼镜「复活」了!AI 时代的涅槃
2014 年 Google Glass 发布后,Google 重新推出智能眼镜 Project Aura,采用 Gemini 技术提升视觉和语音交互能力。Project Aura 结合了 Google 和 Xreal 的技术力量,并将于 I/O 2025 上正式发布。