GPT-4o
重磅!OpenAI开放满血o1模型API,成本暴降60%
今天凌晨2点,OpenAI发布了o1模型的新API,并升级了实时API支持WebRTC。o1模型的API成本降低60%,价格下降10倍;新增函数调用、结构化输出和开发者消息等新功能。OpenAI还推出偏好微调方法来适应特定应用场景。
GPT-4其实根本听不懂声音?港中文、斯坦福等联合打造视觉听觉评估新基准
多模态大模型在听觉任务上表现不佳,甚至无法正确分辨明显不同的声音大小。研究团队提出了DeafTest和AV-Odyssey基准测试,揭示了现有模型在音频感知上的短板,并激发了对未来AI模型的改进方向。
OpenAI 贺岁短剧第6集:ChatGPT化身圣诞老人,还能视频通话!GPT-4o多模态能力再升级
OpenAI推出ChatGPT新功能,包括视频和屏幕共享的Advanced Voice Mode升级,以及限时推出的Santa Mode与圣诞老人实时对话。这些更新展示了AI在个性化和情感化方向的巨大潜力。
OpenAI 在亚洲的首届黑客松,这三个作品获奖了
上周在OpenAI的开发者活动中,他们与GovTech合作举办了一场亚洲首届黑客马拉松。活动主题为”AI for the Public Good, for Singapore and the World”,鼓励开发者将OpenAI API应用于公共利益项目。最终评选出三名优胜作品。第一名应用了一款自动化服务应用程序以提高老年人的服务效率;第二名制作了一款语言学习游戏来推广普通话;第三名为帮助老年用户服药提醒和副作用监测的应用赢得了第一名。
超越GPT-4o!开源科研神器登场,4500万篇论文检索增强生成靠谱回答
首个完全开源的科学助手语言模型OpenScholar在4500万篇论文数据存储库中表现优异,能够高效检索和回答科研相关问题。它比GPT-4o更可靠且成本更低。
视觉语言模型能否实现鲁棒的数学推理?UC伯克利发布测评基准DynaMath
本文介绍了一项新的动态生成的测评基准DynaMath,用于评估和研究视觉语言模型在处理多模态数学问题时的推理能力。通过分析当前最强的一些视觉语言模型(如GPT-4o)在简单数学题上的表现,发现它们存在漏洞和鲁棒性不足的问题。DynaMath提供了501个高质量、多主题的种子问题及其变体,评估了14个最先进的视觉语言模型的表现,揭示了其推理稳健性的局限性。