学术
TNNLS 2025 通用的视觉Backbone!TransXNet: 全局动态性+局部动态性=性能强大,代码已开源!
香港大学俞益洲团队提出TransXNet,结合D-Mixer和Multiscale Feed-forward Network架构,在图像分类、目标检测、语义分割任务上均取得显著性能提升。
合成数据助力视频生成提速8.5倍,上海AI Lab开源AccVideo
本文提出了一种高效蒸馏方法AccVideo,通过合成数据集加速视频扩散模型生成速度,相比教师模型(HunyuanVideo)提升了8.5倍的生成速度,并显著减少了推理步骤。
U-Net和ViT凑一块,会发生什么?U-REPA:精准对齐Diffusion U-Net与ViT特征空间,训练提速42%
U-Net 架构对齐到 ViT(Vision Transformer)特征空间
的新方法
U-REP
刚刚,DeepSeek公布了推理引擎开源路径,OpenAI也将开始连续一周发布
DeepSeek 发布文档宣布将开源自己的内部推理引擎,并与开源社区建立更广泛的合作。文档提到将与现有的开源项目合作,包括 SGLang 和 vLLM 项目。网友猜测 OpenAI 可能会发布多种模型和智能体产品。
图解DeepSeek V3 biased_grouped_topk cuda融合算子fused_moe_gate kernel
thub.com/sgl-project/sglang/blob/main/python/sglan
10万奖金×认知升级!OceanBase首届AI黑客松广发英雄帖,你敢来么?
OceanBase 通过 AI 原生数据库重新定义分布式数据库,利用 SQL + AI 一体化技术打破 TP 和 AP 的次元壁。OceanBase 将举办首届 AI 黑客松大赛,邀请开发者使用 OceanBase 数据库构建具有实际应用价值的产品或解决方案。
过程奖励模型也可以测试时扩展?清华、上海AI Lab 23K数据让1.5B小模型逆袭GPT-4o
清华大学刘润泽等人提出生成式过程奖励模型GenPRM,通过思维链推理和代码验证增强大语言模型的推理能力。仅23K训练样本就取得了优异性能,展示了测试时扩展在提升小模型表现上的潜力。
3710亿数学Tokens!全球最大开源数学数据集MegaMath震撼发布,碾压DeepSeek-Math
指标。
近日,LLM360 推出了
MegaMath:全球目前最大的开源数学推理预训练数据集
,共计