分享 – 第 49 页

新的Mamba架构又双叒来了！上交大 & 华为提出QuadMamba ：多个视觉任务SOTA!

下午11时 2024/11/25 作者极市干货

↑ 点击
蓝字
关注极市平台
作者丨AI视界引擎
来源丨AI视界引擎
编辑丨极市平台
极市导读
该研

再见RAG，你好Agentic RAG！

上午11时 2024/11/25 作者 PaperAgent

在2023年，检索增强型生成（RAG）技术占据了主导地位，而在2024年，智能体工作流程正在推动巨大

Inf-CL: 把 Contrastive Loss 的 Batch Size 冲到100M!

下午11时 2024/11/24 作者极市干货

↑ 点击
蓝字
关注极市平台
作者丨藤原豆腐皮儿@知乎（已授权）
来源丨https://zhuanl

大模型对齐中的各种loss讲解

下午11时 2024/11/24 作者极市干货

↑ 点击
蓝字
关注极市平台
作者丨ybq
来源丨NLP工作站
编辑丨极市平台
极市导读
本文深入讲

微软Ignite 2024：建立一个Agentic世界！

上午11时 2024/11/24 作者 PaperAgent

在今年的Microsoft Ignite 2024上，企业通过Copilot Studio创建了数万智能体，并且可以使用Azure目录中的1800个LLM模型。微软还宣布将在Microsoft 365中引入新的智能体，包括用于项目管理的新项目经理智能体、协作会议中的新Facilitator智能体、帮助员工理解和分享知识的Agent以及提供自助服务支持的员工自助服务智能体。

o1圈杀疯了，阿里又开源Marco-o1

下午1时 2024/12/11 上午11时 2024/11/23 作者 PaperAgent

阿里开源Marco-o1，旨在解决缺乏明确标准且奖励难以量化的开放式问题。Marco-o1结合链式思考、蒙特卡洛树搜索等技术增强推理能力，在MGSM上提高了准确性，并展示了扩展解决方案空间和利用更细粒度动作策略的优势。

NeurIPS’24｜VL-SAM：北大出品，完全无训练的开放式检测分割模型

下午2时 2024/12/15 下午11时 2024/11/22 作者极市干货

北大团队提出VL-SAM，结合视觉-语言模型和Segment-Anything模型，通过注意力图作为提示解决开放式物体检测与分割任务，性能在LVIS和CODA数据集上良好。

从啥也不会到DeepSpeed——一篇大模型分布式训练的学习过程总结

下午2时 2024/12/15 下午11时 2024/11/22 作者极市干货

↑ 点击
蓝字
关注极市平台
作者丨elihe@知乎（已授权）
来源丨https://zhuanla

一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31