矩阵乘法可以算得更快了!港中文10页论文证明:能源、时间均可节省
香港中文大学提出了一种名为RXTX的新算法,通过结合机器学习搜索方法和组合优化技术,显著提升了XXt的计算效率。与原算法相比,RXTX的设计使得递归关系式为R(n)=8R(n/4) + 26M(n/4),比基Strassen的递归分治方法降低了约5%的渐近乘法常数。
香港中文大学提出了一种名为RXTX的新算法,通过结合机器学习搜索方法和组合优化技术,显著提升了XXt的计算效率。与原算法相比,RXTX的设计使得递归关系式为R(n)=8R(n/4) + 26M(n/4),比基Strassen的递归分治方法降低了约5%的渐近乘法常数。
香港中文大学等团队提出Flow-GRPO,首个将在线强化学习引入流匹配模型的工作。显著提升图像生成模型在复杂场景理解、文本渲染任务上的性能,将SD3.5 Medium准确率从63%提升至95%,组合式生图能力超越GPT-4。
香港中文大学等机构联合推出FormalMATH基准测试,包含5560道经过验证的数学题。尽管大语言模型在自然语言处理和代码生成领域表现优异,但在数学定理证明任务中成功率仅为16.46%。研究提出了一套三阶段过滤框架用于自动形式化和语义一致性检测,并分析了现有LLM证明器的表现,发现代数较强而微积分较弱,存在滥用自动化策略的问题。
本文介绍了一种基于规则的强化学习(RL/RFT)在GUI智能体领域的应用,UI-R1模型通过精心设计的奖励函数和高效的数据筛选策略提升了跨领域的任务表现。
北京理工大学等4大名校联合发布Mini DALL·E 3,无需额外训练即可为多数主流大模型添加文成图多模态输出能力。该系统由语言模型、路由器、适配器和图像生成模型四大模块组成,实现了用文本生成图像。
ATEC2025科技精英赛由香港中文大学等主办,聚焦AI与机器人技术。设置软件算法和硬件设计双赛道,提供高达21万美元奖金,并邀请顶尖学者和技术领袖进行交流。报名截至4月25日,详情见www.ATECup.com。
多模态思维链(MCoT)系统综述发布,介绍了其基本概念、分类法和应用场景,并探讨了当前挑战及未来研究方向。通过推理构建视角、结构化推理视角等六大技术支柱提升模型能力,改变机器人的操作、自动驾驶的安全性、医疗诊断的速度与准确性以及教育的个性化教学等方面。论文链接:https://arxiv.org/pdf/2503.12605