学术归档 - 第188页共193页

NeurIPS 2024｜收敛速度最高8倍，准确率提升超30%！华科发布MoE Jetpack框架

下午8时 2024/12/15 下午11时 2024/11/21 作者新智元

华中科技大学提出MoE Jetpack框架，利用密集模型预训练权重微调为混合专家模型，显著提升精度和收敛速度。

下午8时 2024/12/15 下午11时 2024/11/21 作者极市干货

↑ 点击
蓝字
关注极市平台
作者丨AI生成未来
来源丨AI生成未来
编辑丨极市平台
极市导读
模型

下午8时 2024/12/15 下午11时 2024/11/21 作者极市干货

本文介绍了如何使用TensorRT加速通过PyTorch Eager Mode量化接口生成的量化模型，包括量化步骤、修复ONNX模型图以及构建和验证TensorRT引擎等内容。

下午2时 2024/11/21 作者每时AI

近日，字节跳动豆包大模型团队提出 SuperClass，一个超级简单且高效的预训练方法。该方法首次舍

下午2时 2024/11/21 作者每时AI

论文标题：
Backward Lens: Projecting Language Model Gra

下午2时 2024/11/21 作者每时AI

©作者 |
王奕森
单位 |
北京大学
自我纠错（Self Correction）能力，传统上被视为

下午1时 2024/11/21 作者每时AI

机器之心原创
编辑：Panda
扣
子 Coze OpenAPI 不仅具备低延时、定制化、随时打断和

下午1时 2024/11/21 作者每时AI

机器之心报道
编辑：泽南、小舟
租用 H100 的钱只需 233 美元。
还记得 Andrej Ka

下午1时 2024/11/21 作者每时AI

近日，DeepMind团队与马里兰大学研究人员在结合水印技术和投机采样方面取得进展。研究揭示了水印强度和采样效率之间的不可行定理，并提出了两种方法来平衡两者。研究表明，在保持检测效率或速度上存在权衡关系，未来需要设计新算法以应对这一挑战。

下午1时 2024/11/21 作者每时AI

谷歌发布AlphaQubit，利用AI提高量子处理器的纠错准确性，目标是让量子计算更加可靠。