模型表现归档

桥接学术与落地！同济、清华提出实用的金融时间序列全维度评测系统

上午8时 2025/03/16 作者 PaperWeekly

列预测方法分类
金融时间序列预测在量化投资领域中占据着核心地位。由于市场价格变化受到多种因素的影响，

下午4时 2025/02/28 作者机器之心

近日，谷歌发布了一项高难度基准BIG-Bench Extra Hard（BBEH），旨在评估AI模型的高阶推理能力。该基准包含了23个任务，并将每个任务替换为更难的任务，覆盖更多方面的技能需求。如o3-mini (high)得分为44.8分不及格，而其它模型得分不超过10分。

下午4时 2025/02/14 作者量子位

造就了不同品种广泛分布在世界各地的生命奇迹；同样人也需要通过双耳沉浸式享受电影视听盛宴、判断驾驶环境