日期: 2025 年 1 月 27 日
神经网络理论与技术学习以及工具
文章介绍了神经网络模型的学习方法,包括数学计算工具(如PyTorch和TensorFlow)以及神经网络模型结构。强调了理论基础的重要性,并提到了训练过程中的损失计算、反向传播等步骤。学习建议是从案例开始实现自己的神经网络模型,理解其工作机制再深入实践。
阿里Qwen2.5-1M开源,仅320G可推理14B百万token
阿里千问开源了Qwen 2.5-1M模型及其对应的推理框架,支持百万Token上下文处理,并分享了训练和推理框架的设计细节及消融实验结果。
LeCun:Deepseek爆火不能说明中国AI强,只能说开源模型很强
MLNLP社区是一个国内外知名的机器学习与自然语言处理学术社群。DeepSeek-R1的发布引起了全球AI社区的关注,其在基准测试中的卓越性能引发了对OpenAI领先地位的质疑。DeepSeek的成功不仅展示了开源模式的优势,还引发了硅谷对于技术进步及商业模式的重新审视。
成功率97.8%!中科院PPTAgent模拟人类制作流程,高质量PPT轻松搞定
中科院提出PPTAgent,一种基于编辑的两阶段PPT生成框架,它通过分析和生成高质量PPT,显著提高了文本、设计和连贯性的评估评分,并在多个领域表现出色。
《黑神话:悟空》制作人冯骥推荐DeepSeek!
《黑神话:悟空》制作人冯骥分享DeepSeek AI大模型的惊人表现,并建议用户访问https://chat.deepseek.com使用全新R1版本,强调其强大的功能和潜力。