大模型
大语言模型
AAAI 2025 免训练低成本!上海交大提出用于高效扩散模型的令牌剪枝方法
上海交通大学提出SiTo方法,通过基于相似性的令牌剪枝技术,无需训练且硬件友好地加速扩散模型。显著提升了生成质量并减少了内存和计算成本。
威立执行副总裁Jay Flynn接受科技日报采访:科学出版数字化转型的见证者
威立执行副总裁杰伊·弗林谈见证中国科研迅猛发展、人工智能在出版领域的应用以及向开放获取转型的重要性。他指出中国作者发表论文数量位列世界首位,并积极推动全球学术交流与合作。
神经网络理论与技术学习以及工具
文章介绍了神经网络模型的学习方法,包括数学计算工具(如PyTorch和TensorFlow)以及神经网络模型结构。强调了理论基础的重要性,并提到了训练过程中的损失计算、反向传播等步骤。学习建议是从案例开始实现自己的神经网络模型,理解其工作机制再深入实践。