大模型
大语言模型
科研速递 TPAMI 2025:深度神经网络模型对抗攻击与防御平台 A³D开源发布
该研究提出了一种自动对抗攻击与防御(Auto Adversarial Attack and Defense, A³D)平台,通过自动机器学习技术优化深度神经网络架构和对抗攻击方案,提升模型鲁棒性和安全性。平台支持多种鲁棒性评估方式,并能协同进化以提高整体性能。
又一篇CCF-A!强化学习+多目标优化,吊打传统方法!
文章摘要:顶会论文探讨了强化学习与多目标优化融合提升AI决策能力的技术。港科大和MIT团队通过不同方法在自动驾驶及机器人控制中实现安全性和能效的双重提高;阿里云技术则优化金融交易系统的风险收益平衡,这些成果重塑智能决策边界。
ICLR 2025 LLM优化收录创新高!Dobi-SVD超高压缩与性能完美平衡!
ICLR 2025将于新加坡举行,重点在大模型优化和训练效率提升。研梦非凡提供直播课,详解Dobi-SVD压缩方法,并邀请杨导师解读相关论文。
我用了一天马斯克的 Grok Workspace,发现 ChatGPT Projects 不香了!
马斯克的xAI在Grok上悄悄上线了新的Workspace功能,它类似于ChatGPT的Project,可以存对话、传文件、加自定义指令,并记住上下文。虽然看似简单,但表现尚可。
关于人工智能应用在科研领域方面的探索——中国科学院人才交流开发中心高级研修班
中国科学院人才交流中心举办人工智能研修班,旨在提升科研人员的数字化素养和应用能力。该研修班强调实际操作能力和创新能力培养,并通过线上线下同时进行的方式提供系统化培训。
GPT-4.1 凌晨刚发布,我连夜接入公众号!免费开放,无限畅聊!
OpenAI发布的新模型GPT-4.1接入公众号,提供超长记忆、多模态能力等新功能。相比之前版本,GPT-4.1在写作、分析长文档等方面表现更出色,现已免费上线体验。