限定120分钟科研挑战,o1和Claude表现超越人类
人类VS AI的科研能力大比拼:基于Claude 3.5 Sonnet和o1-preview构建的智能体2小时内表现远超人类专家,但随着时间增加,人类专家的表现更为显著。研究显示AI更适合处理大量并行的短期任务,而人类更适应复杂长时间的研究。
人类VS AI的科研能力大比拼:基于Claude 3.5 Sonnet和o1-preview构建的智能体2小时内表现远超人类专家,但随着时间增加,人类专家的表现更为显著。研究显示AI更适合处理大量并行的短期任务,而人类更适应复杂长时间的研究。
北大团队开发的ChatExcel最新升级版,一句话就能搞定线性分析、图表绘制及文字总结。它能处理多表格数据,并支持400个Excel函数进行复杂数据分析与报告生成。
Meta团队提出SAMURAI模型,使用经典卡尔曼滤波器解决了SAM 2在快速移动物体场景下的跟踪问题。它在视觉目标跟踪任务上取得了显著改进,无需重新训练即可运行,并且已在多个基准数据集上超过了原始SAM 2的表现。
Anthropic从亚马逊获得40亿美元投资,并将使用AWS Trainium和Inferentia芯片训练模型。双方合作开发定制AI芯片,允许客户使用自己的数据微调Claude模型。
NumPro通过为视频帧添加数字标识符的方式提升了视频大模型的时序定位能力。无需训练设置即可增强模型对事件发生时刻的理解,实验结果显示其显著优于现有方法,并且不影响模型通用视频理解能力。
法国国家科学研究中心和香港大学的研究人员提出了一种基于柔性磁膜的触觉传感器,该传感器能够实现三维力的自解耦。通过设计正交磁化的Halbach阵列,可以简化传感器结构并降低标定复杂度,为低成本的三维力触觉传感提供了新思路。
新加坡国立大学团队测试发现,AI系统Claude可以在多个场景下自动完成任务,包括玩手游、购物下单、办公自动化等。Claude不仅能操作GUI界面,还能理解游戏规则并调整策略,展示了其在多种任务中的强大能力。论文还提出了一种开箱即用的自动GUI框架。
IDEA研究院最新成果DINO-X通用视觉大模型,在各种开发世界感知和目标理解任务中实现全面检测、泛化能力增强、细粒度目标理解和多任务感知,已在多个基准测试中获得新SOTA成绩。