百度文小言升级进击!多模型融合调度,玩转AI生图+视频,还有交互技术的三层创新
百度在新一期AI DAY活动中展示了文小言品牌焕新与功能升级,包括引入多种模型以增强语音语言交互和多任务处理能力。新产品通过自动调用最优模型组合实现了创新功能如‘图片问答’及图生视频。同时,百度团队在语音交互技术上进行了迭代改进,提升交互效率与舒适度。
百度在新一期AI DAY活动中展示了文小言品牌焕新与功能升级,包括引入多种模型以增强语音语言交互和多任务处理能力。新产品通过自动调用最优模型组合实现了创新功能如‘图片问答’及图生视频。同时,百度团队在语音交互技术上进行了迭代改进,提升交互效率与舒适度。
OpenAI宣布完成400亿美元融资,估值达3000亿美元。资金将用于扩展计算基础设施、为用户开发新工具以及与软银合作加速美国数据中心网络建设。该公司还预告即将发布一款具有推理能力的开源权重语言模型,并计划举办开发者活动收集反馈意见。
近日,朱啸虎在中关村论坛发表演讲,强调AI应用层的重要性,并建议创业公司应全力拥抱开源模型和API,专注于商业化而非底层模型训练。他认为中国科技投资需关注成熟期后的平权收益,同时指出当前国内竞争白热化,建议创业者出海建立产品和团队优势。
据报道,小米SU7标准版在高速公路上发生事故导致三人死亡。事发时车辆处于NOA智能辅助驾驶状态,驾驶员在系统提示后未能及时接管并制动,最终以约97km/h撞击隔离带水泥桩。此事件引发对AEB功能失灵及事故后车门是否锁死的争议。
跨维智能发布’一次示教即会'(YOTO)技术,机器人通过单次观察和学习就能掌握复杂任务操作。该技术无需人工标注或遥操设备,在虚拟空间中增殖数据,并利用DexBiDP策略确保双臂高效执行,显著提升机器人适应性和效率。
Runway 发布了最新 AI 视频生成模型 Gen-4,其画面真实感、动态流畅度和创作可控性取得重大进步。Gen-4 能够生成逼真运动的视频,并具备优秀的提示遵循能力和全球理解能力。