基于Gemini 多模态实时API 的7个AI Native 应用例子
Google推出的Gemini Stream Realtime让AI助手具备实时观察、互动和反馈的能力。该文章介绍了七大实用场景,包括研究助理模式、软件学习教练、即时翻译官等,展示了AI助手作为超级助理的潜力,改变了我们与AI互动的方式。
Google推出的Gemini Stream Realtime让AI助手具备实时观察、互动和反馈的能力。该文章介绍了七大实用场景,包括研究助理模式、软件学习教练、即时翻译官等,展示了AI助手作为超级助理的潜力,改变了我们与AI互动的方式。
OpenAI 发布全新桌面版 ChatGPT,支持与30多种应用协作提升写作和编程能力。演示中展示了多款应用的交互功能,包括Git命令生成图表、IDE操作等。同时支持Notes、Notion和Quip等多种应用。
谷歌推出Android XR操作系统,旨在推动虚拟现实、增强现实和混合现实技术的发展与普及,支持数十亿用户,并与Magic Leap合作开发XR技术。首款采用Android XR设备的‘Project Moohan’将于明年上市,带来无缝切换虚拟环境和现实世界的能力及AI助手Gemini交互功能。
谷歌发布了视频生成模型Veo 2,声称其可以更好地理解现实世界及人类运动表达的细微差别。Veo 2能生成分辨率高达4K(4096 x 2160像素),时长为2分钟的视频片段。
Google发布了Gemini 2.0和Veo 2模型,并加强了Imagen 3,而OpenAI则在产品与商业化方面发力。两者举动显示了不同的战略方向。
Google发布了AI视频模型Veo 2和改进版的AI绘图模型Imagen 3。Veo 2在OpenAI发布个性化的AI搜索后,展示了极高的物理效果和稳定的运动质量,并通过Meta发布的基准数据集MovieGenBench进行了测试。Imagen 3则展示了一种更加自然、流畅的人类观察者体验。Google还强调了其模型的稳定性和上限。
作者
|
Jessica
邮箱
|
JessicaZhang@pingwest.com
新的一周,O
Gemini 2.0通过简单指令即可实现图片一键P图,包括车内装满海滩用品、更改车身颜色等。它还能同时修改多个元素,并结合不同图像生成新形象,如猫变成抱枕或猫代言滑板。