跟GPT4o、o1拜拜,Gemini2.0取代了我的AI应用们
Gemini-2.0-flash-exp 和 Gemini-2.0-flash-thinking-exp 成为日常对话和代码生成高频模型。速度比 o1 快 5 倍,免费使用。API Key 可以通过 https://makersuite.google.com 获取。
Gemini-2.0-flash-exp 和 Gemini-2.0-flash-thinking-exp 成为日常对话和代码生成高频模型。速度比 o1 快 5 倍,免费使用。API Key 可以通过 https://makersuite.google.com 获取。
最近几天常用生图工具Whisk生成的图片效果令人惊喜。通过两张参考图片,可以轻松实现复杂的构想。使用Whisk能大幅降低创意绘画门槛,用户无需详细描述人物长相、穿着和背景环境,只需上传主题图片和风格图片即可。
OAI第十二天直播收官之作展示DALLE4强大实力,多项测试中o3表现远超前代模型,包括ARC-AGI、EpochAI Frontier Math等任务均创纪录。但o3仍处于预览阶段,仅限通过网站申请的用户内测。
文章介绍了可灵1.6版本在物理世界、人物动作、人物表演、特效表演和多主体等方面的表现。通过对比Voe2展示了可灵的提升,强调了其在真实世界复刻和复杂情绪表达上的优势,并提到了未来开发的方向。
OpenAI公布GPT Search更新后,谷歌推出4K版Veo 2。其支持生成4K视频、延长视频时长至几分钟,并具备真实物理交互能力。Veo 2效果惊艳,几乎看不出生成痕迹;Google还通过Meta数据集进行评测。此外,Imagen3和Whisk等新工具展示了AI在多模态领域的创新。
通过横向对比星流、Midjourney和Recraft三个AI生图工具的功能多样性、操作便捷性和语义理解能力,文章展示了StarFlow的高级审美效果。测试结果显示StarFlow在多个风格场景下表现出色,尤其擅长处理细节和复杂场景。作者认为StarFlow具有成为主流生图工具的潜力。
Sora新功能更新包括Storyboard、Recut剪辑、Remix重绘、Loop循环和Blend过渡融合。故事板界面支持多种动作的生成,Remix允许局部元素替换或新增,并提供了程度控制。发布会展示了这些新特性及背后原理。