大模型
你了解大模型的生态体系吗?大模型从技术到应用的内容梳理
梳理了大模型体系构成和应用关系,介绍了神经网络作为机器学习的一种深度学习方式的基本原理及其在自然语言处理、计算机视觉等领域的结合应用,并阐述了不同架构如Transformer、RNN的工作机制,强调了神经网络并非万能及需要具体任务场景来发挥作用。
让AI替码农卷复杂任务,贾佳亚团队提出MoTCoder,准确率刷新SOTA
论文提出MoTCoder模型,通过模块化思维显著提升大语言模型在复杂编程任务中的准确率与可维护性。团队已开源代码、模型和数据集供在线体验。
大模型除了聊天还能做什么?关于大模型的分类和应用
文章介绍了大模型分类的复杂性及用户和技术两个角度的大模型应用,并强调了实际需求的重要性,建议根据任务需求选择合适的模型,同时指出当前大模型评估标准缺失的问题,鼓励多尝试和研究。
1小时AI公开课上线啦~首期课程解密传统企业如何抓住AI革命!
在人工智能技术加速渗透各行各业的今天,《1小时AI公开课》系列直播课程推出,聚焦大模型、Agent、Prompt工程等前沿技术。首期课程将于4月11日晚8点开讲,由AIGC开放社区专家李扬主讲,内容涵盖AI进化论、AI百年演进与突破、AGI应用全景透视等多个模块,旨在为企业管理者、技术团队及个人开发者提供系统化的AI转型指引。
ICLR25|史上最全面的多模态知识编辑基准!北京通用人工智能研究院BIGAI联合中科大提出MMKE – Bench!
出MMKE – Bench,这是史上最全面的多模态知识编辑基准,涵盖跨越33个广泛的类别视觉实体编辑
idea满满的最新Test-Time Scaling综述!全面描述What, How, Where和How Well的问题
MLNLP社区发布一篇关于Test-Time Scaling(TTS)的survey论文,介绍大语言模型在测试阶段增加计算资源的方法,让模型能够更智能地解答问题。