WWW 2025 TAMU、UIUC等提出全新因素链框架,用于论文-评审人匹配 下午11时 2025/03/05 作者 PaperWeekly 提交数量的迅速增加,我们越来越依赖有效的论文-评审人匹配模型。此前在这一领域的研究考虑了多种因素来评
ICLR 2025 SOTA性能!OSTQuant:基于正交与缩放变换的大模型量化方法 下午11时 2025/02/24 作者 PaperWeekly 同的量化配置中(weight-only、weight-activation 和 weight-act
比肩LLaMA 3!人大高瓴提出语言模型新范式:首个8B扩散大语言模型LLaDA 下午11时 2025/02/22 作者 PaperWeekly 突破性进展,展现了诸如上下文学习、指令遵循、推理和多轮对话等能力。目前,普遍的观点认为其成功依赖于自
图像生成迎来CoT时刻!港中文首次提出文生图的o1推理和inference scaling新范式 下午4时 2025/02/07 作者 PaperWeekly 理能力的强大提升,各种基于强化学习 RL 和提升 test-time 推理成本的方案 已经在大模型理
顶刊TPAMI 2025!清华提出Hyper-YOLO,目标检测+超图计算实现新SOTA 下午4时 2025/02/04 作者 PaperWeekly ©作者 | iMoon-Lab 单位 | 清华大学 来源 | 新智元 YOLO(You Only L
浙大、南栖仙策推出SMAC-HARD,多智能体强化学习算法评估Hard模式来了 下午4时 2025/01/06 作者 PaperWeekly ©作者 | 邓悦 单位 | 浙江大学博士生 来源 | 机器之心 本文作者来自浙江大学、中国科学技术大
AAAI 2025 UC Berkeley、阿里提出NMT,四行代码解决搜推任务中的目标冲突问题 下午4时 2025/01/06 作者 PaperWeekly ©PaperWeekly 原创 · 作者 | 咕咕 背景:工业界中的目标冲突问题 在工业界实际的搜广
浙大、微软等发布最新综述,深入探索语音对话模型的前沿进展 下午11时 2024/12/30 作者 PaperWeekly ©作者 | 季圣鹏 单位 | 浙江大学 在人机交互日益智能化的今天,语音对话模型正引领 AI 领域的
NeurIPS 2024 让模型预见分布漂移:动态系统颠覆性设计引领时域泛化新革命 下午2时 2024/12/10 作者 PaperWeekly TL;DR: 本研究提出了一种方法,能够在领域数据分布持续变化的动态环境中,基于随机时刻观测的数据分
简单有效!Vector Quantization的又一技巧:给编码表加一个线性变换 上午8时 2024/12/10 作者 PaperWeekly ©PaperWeekly 原创 · 作者 | 苏剑林 单位 | 科学空间 研究方向 | NLP、神经