CVPR’25跨模态因果对齐,让机器更懂视觉证据丨中大南洋理工等联合开源
来自中山大学、新加坡南洋理工大学等团队提出跨模态因果对齐框架(CRA),通过抑制噪声、特征对齐和因果关系建模三个模块优化视频问答定位任务,显著提升模型的时空定位能力和因果推理准确性。
来自中山大学、新加坡南洋理工大学等团队提出跨模态因果对齐框架(CRA),通过抑制噪声、特征对齐和因果关系建模三个模块优化视频问答定位任务,显著提升模型的时空定位能力和因果推理准确性。
小米大模型团队通过微调阿里Qwen2-Audio-7B模型,结合DeepSeek-R1的GRPO算法,在MMAU评测集上实现了64.5%的准确率,显著提升31%,接近人类专家水平。
通过ReActMCP Web Search服务集成网络搜索能力到AI助手中,支持基本和高级搜索功能,并可返回Markdown格式的搜索结果。
Model Context Protocol (MCP) is an open-source protocol developed by Anthropic to standardize the connection of LLMs to contexts, tools, and prompts. It enables seamless integration of AI agents with external data sources and tools.
阿里通义实验室薄列峰团队首次将RLVR应用于全模态LLM,聚焦情感识别任务。R1-Omni模型提升了推理、理解与泛化能力,在多模态数据集上表现出色,并已开源。
MCP是一种新的开放协议,旨在标准化大型语言模型上下文接收方式,提供统一接入简化AI集成,支持动态发现和实时双向通信。
一款结合大语言模型和网络搜索功能的AI研究助手Local Deep Research,支持终端和网页界面使用,具备自动化深度研究、智能信息筛选及PDF导出等功能,强调隐私与效率并重。