CVPR 2025 Oral DiffFNO:傅里叶神经算子助力扩散,开启任意尺度超分辨率新篇章

本文提出了一种名为 DiffFNO 的方法,利用神经算子和扩散模型解决超分辨率问题。它通过加权傅里叶神经算子、门控融合机制和自适应 ODE 求解器实现了高精度和快速推理,超越了现有技术。

中科院开源PPT Agent,一键自动生成PPT智能体

中国科学院的研究人员开源了PPTAgent,它能通过分析精美参考幻灯片提取内容模式和布局结构,并逐步编辑优化生成PPT。该工具的核心技术在于其独特的两阶段方法及自我修正机制,显著提升PPT的质量、设计和连贯性。

谷歌再次创造历史:Gemini 2.5 Pro 通关《宝可梦:蓝》!

谷歌Gemini 2.5 Pro模型成功通关经典游戏《宝可梦:蓝》。软件工程师Joel Z搭建系统连接模拟器,通过分析内存信息自主决策玩游戏。项目强调不是基准测试,而是展示不同AI的思考方式差异。