Transformer架构归档

牛津大学等深挖746万成年人健康数据开发早筛算法，基于血液指标实现15种癌症早期预测

上午11时 2025/05/27 作者 HyperAI超神经

队合作，基于英格兰地区 746 万成年人的匿名电子健康记录，开发了 2 种新型癌症预测算法：基础算法

上午11时 2025/05/01 作者 AIGC开放社区

小米发布大模型MiMo-7B，参数70亿，在数学和代码测试中表现优异。MiMo-7B架构简单且效率高，通过MTP模块加速推理。训练数据集包含多种合成推理任务生成的数据，采用三阶段混合策略优化分布。后训练阶段通过SFT调整预训练模型，并使用高质量的强化学习数据提升性能。

下午11时 2025/04/28 作者极市干货

的极简自回归视觉生成框架。
>>
加入极市CV技术交流群，走在计算机视觉的最前沿
本文目录
1 Si

下午2时 2025/04/28 作者小兵的AI视界

知识和大量的时间，而新兴的
AI
驱动的
3D
生成技术正在改变这一局面。
阿里巴巴通义实验室最近开

下午11时 2025/04/23 作者 AI寒武纪

斯坦福推出免费在线课程CS25: Transformers United V5，涵盖Transformer架构及其应用，包括语言模型、强化学习、AGI等前沿话题。

上午8时 2025/04/17 作者 AIGC开放社区

专注AIGC领域的专业社区分享了Transformer架构在生成式AI中的应用及存在的问题，并提出了5个解决方案。

下午11时 2025/03/28 作者开源AI项目落地

阿里开源的LHM项目基于Transformer架构，能够在几秒内从单张图像重建高保真、可动画的3D人体模型，提升重建准确性、泛化能力和动画一致性。