推理模型新路线开源!与DeepSeek截然不同,抛弃思维链不用人类语言思考

开源推理大模型新架构Huginn采用了不同于Deepseek-R1/OpenAI o1的方法,直接在高维潜空间中用隐藏状态进行推理。该模型在处理数学问题时能快速收敛到正确答案,并通过观察其推理轨迹发现了复杂的现象,如对关键数字形成圆形轨道等。

Florence-VL来了!使用生成式视觉编码器,重新定义多模态大语言模型视觉信息

本文介绍了一种基于生成式视觉编码器Florence-2的多模态大语言模型Florence-VL,通过创新的深度广度融合策略结合多层次、多任务视觉特征,实现了在多种多模态基准任务上的卓越性能。

NeurIPS 2024 水印与高效推理如何两全其美?最新理论:这做不到

近日,DeepMind团队与马里兰大学研究人员在结合水印技术和投机采样方面取得进展。研究揭示了水印强度和采样效率之间的不可行定理,并提出了两种方法来平衡两者。研究表明,在保持检测效率或速度上存在权衡关系,未来需要设计新算法以应对这一挑战。