谷歌Gemini频繁更新,这次能逆袭吗?

谷歌 Gemini AI 最近动作频频。发布了参数量仅为 DeepSeek-V3 1/25 的 Gemma 3,以及支持生图功能的 Gemini 2.0 Flash-Exp 模型,并开放了 Gemini 的 Deep Research 使用权限,升级为自家推理模型 Gemini 2.0 Flash Thinking。新增个性化模式和 Gems 智能体平台等功能。

视频制作新时代来了!Gemini 2 一句话生成所有分镜图片和文案

谷歌发布支持图片生成和编辑的多模态Gemini 2.0模型,原生实现以往需要多种工具才能完成的功能。其能力包括修改上传图片、混合两张图片并生成渲染图、保证人物及场景一致性等,效率高且免费,可直接用于视频创作和剪辑。

“谷歌版DeepSeek”接入机器人,思维链解锁折纸系鞋带技能,推理模型代入物理世界

谷歌发布两款专为机器人打造的模型Gemini Robotics和Gemini Robotics-ER,使机器人能够理解并执行复杂指令,在物理世界中完成精细动作如折纸、系鞋带等,并且具有适应不同身体形态的能力。

谷歌开源单卡最强多模态模型!分数超满血版DeepSeek V3,一张GPU就能跑

谷歌发布Gemma 3系列模型,参数规模有1B、4B、12B和27B四种,支持超过35种语言。它在知名AI排行榜LMArena上的初步人类偏好评估中优于Llama-405B、DeepSeek-V3和o3-mini。开发者可以通过多种途径访问Gemma 3,并附带改进的代码库进行高效微调。谷歌还推出了Gemma 3学术计划,以加速基于Gemma 3的研究。