提示工程101第五课:少样本学习与上下文学习 上午11时 2025/03/29 作者 PyTorch研习社 本文探讨少样本学习和上下文学习技术,使AI模型仅需少量示例就能完成复杂任务,特别适用于标注数据稀缺场景。
Roblox发布3D智能基础模型Cube,一句话生成游戏资产 下午11时 2025/03/21 作者 机器之心 AI 技术,进一步革新游戏的创作体验。 据了解,曾获选「儿童票选奖最受欢迎游戏」的 Roblox
ICLR 2025 小型AI也能懂人类?中山大学全新方法ADPA让小模型对齐实现大突破! 下午4时 2025/03/19 作者 PaperWeekly 型偏好对齐 背景 在 AI 的世界里,大型语言模型( LLMs )凭借强大的参数量和计算能力,已经能
深度学习的平衡之道:港科大、港城大等团队联合发布多目标优化最新综述 下午4时 2025/03/18 作者 机器之心 生陈巍昱、港城大在读博士生张霄远和港科广在读博士生林百炅为共同第一作者;林熙博士目前担任港城大博士后
ICLR 2025 TUM、北大联合提出ConFIG:迈向无冲突训练的逆梯度方法 下午4时 2025/03/17 作者 PaperWeekly 多个应用场景中,联合优化多个损失项是一个普遍的问题。典型的例子包括物理信息神经网络(Physics-
零基础入门:DeepSeek微调教程来了! 下午2时 2025/02/25 作者 Datawhale 的效果。 微调前: 微调后: 在此处可以看到很明显大模型进行微调后口吻已经发生了更改。据笔者使用下来
社区供稿 | 阶跃星辰开源系列 SOTA 多模态模型,技术详解 下午2时 2025/02/19 作者 Hugging Face 我们深知 AGI 的实现离不开全球开发者的共同努力。 因此开源的初心,是希望跟大家分享最新的技术成
卡内基梅隆大学机器人研究所开发Hamba新模型 实现单视角手部3D形状重建 下午4时 2025/01/25 作者 机器人大讲堂 近年来,随着计算机视觉和图形学领域的快速发展,单视角3D手部重建任务逐渐成为研究热点。该技术在机器人
Transformer作者初创重磅发布Transformer²!AI模型活了,动态调整自己权重 下午11时 2025/01/15 作者 新智元 新智元报道 编辑:KingHZ 好困 【新智元导读】 Sakana AI发布了Transformer
DeepMind最新研究:逆向思维训练LLM可大幅提升AI推理能力 下午2时 2024/12/29 作者 机器学习算法与自然语言处理 Google DeepMind的研究表明逆向思维训练大模型(LLMs)能显著提升其推理能力,通过构建包含正反向问题的数据集并利用知识蒸馏框架优化模型。