资讯
news
CVPR 2025 Oral DiffFNO:傅里叶神经算子助力扩散,开启任意尺度超分辨率新篇章
本文提出了一种名为 DiffFNO 的方法,利用神经算子和扩散模型解决超分辨率问题。它通过加权傅里叶神经算子、门控融合机制和自适应 ODE 求解器实现了高精度和快速推理,超越了现有技术。
谷歌NotebookLM终于说中文了!这可是最火的大模型播客产品
NotebookLM 现在支持中文播客,成为多语言AI知识助手。它能将文本、视频等内容转化为引人入胜的AI播客,帮助用户整理信息并提高效率。
中科院开源PPT Agent,一键自动生成PPT智能体
中国科学院的研究人员开源了PPTAgent,它能通过分析精美参考幻灯片提取内容模式和布局结构,并逐步编辑优化生成PPT。该工具的核心技术在于其独特的两阶段方法及自我修正机制,显著提升PPT的质量、设计和连贯性。
谷歌再次创造历史:Gemini 2.5 Pro 通关《宝可梦:蓝》!
谷歌Gemini 2.5 Pro模型成功通关经典游戏《宝可梦:蓝》。软件工程师Joel Z搭建系统连接模拟器,通过分析内存信息自主决策玩游戏。项目强调不是基准测试,而是展示不同AI的思考方式差异。
OpenAI 黑科技 Deep Research 诞生记:一个工程师的“不务正业”如何改变 AI 战争格局
earch(深度研究)。这是一款集成于 ChatGPT 的 AI 研究助手,旨在帮助用户高效地完成复