学术
NeurIPS 2024 哈工深提出新型智能体Optimus-1,横扫Minecraft长序列任务
本文提出Optimus-1智能体框架,结合结构化知识和多模态经验,显著提升Minecraft中完成长序列任务的能力。
微软「AI伴侣」Copilot Vision,让你用嘴浏览网页,还能和你一起打游戏
微软发布Copilot Vision,集成在Edge浏览器中的AI助手能理解用户上网活动,并实时提供帮助。它允许用户与之「协作上网」,提高浏览体验。
OpenAI 12连发第2弹:强化微调,少量样本就能训练自己的专家模型
OpenAI 发布了强化微调技术,允许开发者使用强化学习针对具体任务对模型进行进一步的微调,并根据提供的参考答案对模型的响应进行评分。这种技术能提高其在特定领域上的C2任务上的准确性,并增强模型对类似问题的推理能力。
从答案到问题:一种新的学习目标让LLM更擅长推理
MLNLP社区介绍其愿景促进自然语言处理的学术与产业发展。介绍了REVTINH框架提高大模型推理能力的研究,通过数据增强和学习目标在多个数据集上显著提升表现。