ChatGPT还在靠DALL·E,谷歌Gemini直接实现原生生图!
你见过可以边聊天边画图的 AI 模型吗?谷歌 Gemini 2.0 Flash 现已支持原生图像生成功能,无需切换模型即可实现边聊边画。
你见过可以边聊天边画图的 AI 模型吗?谷歌 Gemini 2.0 Flash 现已支持原生图像生成功能,无需切换模型即可实现边聊边画。
初创公司蝴蝶效应推出的人工智能平台Manus提升了另一款AI工具Browser Use的知名度。自3月3日以来,Browser Use的日下载量增长了五倍多至3月初的28,000次。该平台被X平台上一篇介绍如何使用Browser Use的文章推爆后获得大量关注。
非常具有挑战性的时刻,因为
初创公司的产品质量在很大程度上由模型的质量决定,而模型的变化可能会对初创
2025年,OpenAI发布多款AI Agent工具,包括联网搜索工具、文件搜索工具和计算机操作工具等。OpenAI推出的Responses API能同时调用多个工具,并使用Agents SDK简化Agent的创建与管理。
Google DeepMind发布AI模型Gemini Robotics,使机器人能够在不同环境下执行任务。
LunaMover是一家洛杉矶初创公司,推出了名为’Marey’的AI视频生成模型。该模型基于公开许可数据训练,并能精细控制场景中的动作。Moonvalley声称其风险较低,允许创作者请求内容移除和删除数据。
AI语音在2024年下半年迎来爆发式增长。模型开发进步简化了基础设施,使语音Agent延迟更低、性能更优。GPT-4o API价格大幅下调至$2.50/Million tokens。语音Agent市场渗透率上升,集成到更多产品中。早期应用主要集中在金融服务、BPO、保险、政府和医疗等领域。
一款名为‘谜境Agent’的国产AI创作工具简化了互动小说创作流程,从一句话概述到生成剧本大纲、角色图等,全过程仅需5-10分钟。