卡尔的AI沃茨
跟GPT4o、o1拜拜,Gemini2.0取代了我的AI应用们
Gemini-2.0-flash-exp 和 Gemini-2.0-flash-thinking-exp 成为日常对话和代码生成高频模型。速度比 o1 快 5 倍,免费使用。API Key 可以通过 https://makersuite.google.com 获取。
把动漫带到现实,我用AI跟童年的主角们拍了张会动的大合照
最近几天常用生图工具Whisk生成的图片效果令人惊喜。通过两张参考图片,可以轻松实现复杂的构想。使用Whisk能大幅降低创意绘画门槛,用户无需详细描述人物长相、穿着和背景环境,只需上传主题图片和风格图片即可。
OpenAI发布o3新推理模型,我们离AGI又近了一步
OAI第十二天直播收官之作展示DALLE4强大实力,多项测试中o3表现远超前代模型,包括ARC-AGI、EpochAI Frontier Math等任务均创纪录。但o3仍处于预览阶段,仅限通过网站申请的用户内测。
100镜实测可灵1.6新版本,超大幅度女团群舞都能做了!
文章介绍了可灵1.6版本在物理世界、人物动作、人物表演、特效表演和多主体等方面的表现。通过对比Voe2展示了可灵的提升,强调了其在真实世界复刻和复杂情绪表达上的优势,并提到了未来开发的方向。
谷歌版 4k Sora上手效果分享,它可太懂物理世界和人物运动了!
OpenAI公布GPT Search更新后,谷歌推出4K版Veo 2。其支持生成4K视频、延长视频时长至几分钟,并具备真实物理交互能力。Veo 2效果惊艳,几乎看不出生成痕迹;Google还通过Meta数据集进行评测。此外,Imagen3和Whisk等新工具展示了AI在多模态领域的创新。