AI先锋官，作者每时AI - 第15页共16页

Kimi 终于出手多模态！实测视觉思考模型 K1.VS. 正式版o1，不相上下

2024年12月17日14时作者 AI先锋官

Kimi近日推出视觉思考模型 k1，并宣布对标正式版o1。在数学及物理等多个基础科学领域的测试中，k1-preview均表现出色，甚至超越了OpenAI o1、GPT-4等强模型。同时，k1还具备强大的图像识别能力。

2024年12月17日14时作者 AI先锋官

近日，OpenAI推出Sora和推理大模型o1的完整版本及订阅服务ChatGPT Pro，月费高达200美元。

2024年12月16日22时作者 AI先锋官

作者
｜
沐风
来源
｜
AI先锋官
如果说2023年是AI大模型元年，那2024年无疑是开启了AI

2024年12月13日18时作者 AI先锋官

谷歌三位CEO联合宣布Gemini 2.0 Flash发布，性能超越Gemini 1.5 Pro，并在多模态能力上表现出色。但在经典题目的推理和编程能力测试中表现一般，实测结果引人思考。

2024年12月10日8时作者 AI先锋官

Sora Turbo即将发布，支持生成一分钟视频、多场景切换和角色一致性。OpenAI在最新发布会上展示了Sora的强大功能及其编辑能力，包括Remix、Re-Cut和Blend技术。

2024年12月9日16时作者 AI先锋官

美国科技公司CEO表示，在伦敦举行的C21Media主题演讲中，OpenAI的Chad Nelson展示了即将推出的Sora v2的部分功能特性。Sora v2包括文本生成视频、图像生成视频、视频编辑生成和视频间转换等功能。

2024年12月6日10时作者 AI先锋官

谷歌DeepMind发布Genie 2基础世界模型，可基于单张图片生成可交互的3D世界，并支持用户输入引导。

2024年12月4日8时作者 AI先锋官

李飞飞空间智能发布首个项目：通过一张图片生成逼真3D世界，并实现交互功能。

2024年12月4日8时作者 AI先锋官

腾讯发布混元视频生成模型，参数量达130亿。此模型上线并开源，画质和运动表现均获好评，但在语义理解及镜头切换方面仍需改进。

2024年12月3日9时作者 AI先锋官

斯坦福大学以人为本人工智能研究院（HAI）联席主任李飞飞在《经济学人》专栏中指出，基于视觉的智能或空间智能是人工智能领域的新前沿。她认为这是下一代AI的关键所在，能够通过文本提示控制机器人、生成图像和视频，并在未来应用如家庭护理、手术辅助及教育培训中发挥重要作用。