微软
微软发布创新大模型:一张图片就能生成游戏,游戏界ChatGPT来了
专注于AIGC领域的专业社区报道了微软发布的专用于游戏领域的创新大模型——Muse,它通过游戏画面和控制器操作序列化数据生成连贯的游戏场景和玩法。
微软开源OmniParser V2,直接将DeepSeek-R1变成使用电脑的 AI Agents~
微软发布OmniParser V2,一款开源屏幕解析工具,能够将任何LLM变成能操作计算机的Agent,并包含改进后的数据集和模型,实现更低延迟和更高准确率。
微软开源的纯视觉GUI电脑屏幕解析工具升级了,速度和准确率大幅提升。
OmniParser V2发布,准确率提升和推理速度加快。OmniParser通过视觉解析界面元素,支持大语言模型,提供高效跨平台自动化解决方案。
复旦视频扩散模型综述:覆盖300+文献,探讨近期研究趋势与突破,Github揽星2k+
复旦团队发表综述论文《A Survey on Video Diffusion Models》,系统梳理扩散模型在视频生成、编辑及理解领域的进展,涵盖300+文献。
手掌大小芯片碾压全球算力!微软量子计算核弹级突破,纳德拉:构建全新物质状态
微软发布首款基于马约拉纳新粒子的量子芯片,有望数年内实现百万量子比特计算。该芯片通过拓扑超导体技术保护和读取量子信息,但物理学家质疑其验证过程。