速递|Google推出新AI模型,Gemini Robotics可实现多硬件机器人语音操控
Google DeepMind发布AI模型Gemini Robotics,使机器人能够在不同环境下执行任务。
Google DeepMind发布AI模型Gemini Robotics,使机器人能够在不同环境下执行任务。
LunaMover是一家洛杉矶初创公司,推出了名为’Marey’的AI视频生成模型。该模型基于公开许可数据训练,并能精细控制场景中的动作。Moonvalley声称其风险较低,允许创作者请求内容移除和删除数据。
AI语音在2024年下半年迎来爆发式增长。模型开发进步简化了基础设施,使语音Agent延迟更低、性能更优。GPT-4o API价格大幅下调至$2.50/Million tokens。语音Agent市场渗透率上升,集成到更多产品中。早期应用主要集中在金融服务、BPO、保险、政府和医疗等领域。
谷歌DeepMind发布Gemini Robotics和Gemini Robotics-ER两款AI模型,让机器人能理解复杂环境、执行精细任务,并具有更好的泛化能力、交互性和灵活性。
Sakana AI 推出了AI科学家-v2系统,它通过了ICLR会议一个研讨会的同行评审过程。该系统生成了一篇完整且通过同行评审的科学论文,展现了AI在科学研究中的潜力。