全球首个多模态交互 3D 大模型上线,GPT-4o 没做到的,它先做到了!
GPT-4o 和 Neural4D 2o 是全球首个支持多模态交互的 AI 大模型,实现了文本、图像、3D 等多种模态之间的高效统一处理,大幅提升了内容创作和编辑效率。
GPT-4o 和 Neural4D 2o 是全球首个支持多模态交互的 AI 大模型,实现了文本、图像、3D 等多种模态之间的高效统一处理,大幅提升了内容创作和编辑效率。
AI名流化身卡牌游戏,GPT-4o创造的AGI霸主奥特曼、吉卜力风全家福引爆网络;纽约客文章揭示背后最大功臣是亚马逊前工程师Grant Slatton。
OpenAI宣布,即将在4月30日下线GPT-4,由更强的GPT-4o全面替代。目前,OpenAI还准备了一大批新模型包括GPT-4.1、GPT-4.1 mini/nano和下一代推理模型o系列等。这些新模型正在筹备中,以应对GPT-4退役后的需求。
Meta发布首个原生多模态Llama 4系列模型,性能超越GPT-4。包含Maverick、Scout和Behemoth三个模型,支持1000万token上下文。不过其开源模式存在争议,包括登录Hugging Face账户限制、严格再分发要求及命名要求等。
一款名为EasyControl Ghibli的开源替代方案横空出世,它基于Diffusion Transformer(DiT)架构,免费提供Ghibli风格图像生成功能,支持上传个人照片融入动画宇宙。
今天是2025年4月3日,星期四,北京天气晴朗。文章介绍了关于大模型测试《Large Language Models Pass the Turing Test》,以及RAG用于视频文章生成的方案WIKIVIDEO和面向东方语言的语音识别开源方案Dolphin。
今天凌晨
1点,
OpenAI开源了一个全新的
AI Agent评测基准——
PaperBench。
该基准主要考核智能体的搜索、整合、执行等能力。