速递|红杉中国进军AI测评赛道:xbench为何要“摆脱智力题”考察AI的真实效用?

红杉中国推出全新AI基准测试xbench,采用双轨评估体系和长青评估机制,旨在提高AI系统在真实场景中的效用价值。该测试包含科学问题解答和中文互联网深度搜索两个核心评估集,并提出多项创新举措以解决现有评测方法的问题。

速递|OpenAI CFO解读64亿美元收购:ChatGPT5亿周活用户之后,将开启”AI硬件新时代”

OpenAI首席财务官莎拉·弗莱尔表示,AI硬件将推动ChatGPT订阅量增长,并开启”计算新时代”。她认为与乔尼·艾维公司合作投资可能带来回报,而这种新型硬件设备有望让全球更多用户接触OpenAI技术。

深度|拿下3亿美元融资后,AI金融独角兽Airwallex全球首发支付AI代理金融

金融科技独角兽Airwallex完成3亿美元F轮融资,估值达62亿美元。公司业务从支付扩展至全球企业账户、支出管理等全链条服务,并已持有全球60余张金融牌照。通过AI代理金融,Airwallex希望为企业提供智能化的财务解决方案。

速递|Anthropic CEO表示AI模型的幻觉比人类少,AGI 最早可能在2026年到来

Anthropic CEO Dario Amodei在活动中表示,AI模型产生的幻觉频率低于人类。他认为这并不会阻碍向AGI(具有人类水平或更高智能的AI系统)的发展,并且指出许多幻觉测试都显示AI幻觉现象有所减少。