阿里国际版o1来了,Marco-o1:聚焦开放式问题推理

阿里巴巴国际数字商业集团MarcoPolo团队发布Marco-o1,旨在推进开放式问题解决的大型推理模型。通过集成CoT微调、MCTS和推理动作策略等技术,提高复杂任务处理能力,并在翻译任务中表现出高级理解和推理能力。

NeurIPS 2024 Oral 还原所见!揭秘从脑信号重建高保真流畅视频

NeuroClips 是一种用于 fMRI-to-video 重建的新颖框架,通过感知重建和语义重建实现高质量、高帧率视频的重建。该方法在多项指标上优于现有技术,并展示了良好的神经科学解释性。

NeurIPS’24|VL-SAM:北大出品,完全无训练的开放式检测分割模型

北大团队提出VL-SAM,结合视觉-语言模型和Segment-Anything模型,通过注意力图作为提示解决开放式物体检测与分割任务,性能在LVIS和CODA数据集上良好。

MMRel:多模态大模型时代的评测物体间关系理解新基准

MMRel是首个大规模、高质量的物体间关系理解数据集,用于评估和提升多模态大模型能力。包含超过22K问答对,覆盖三个领域与三种关系类型,通过半自动流程生成并提供高难度子集测试极限性能。