NeurIPS 2024 让大语言模型使用代码解决图分析推理任务
本文提出了一种通过编程来提升大模型解决图分析推理任务能力的方法,并展示了在开源和闭源模型上进行实验的结果,使用新的基准数据集ProGraph验证了这一方法的有效性。
大语言模型
本文提出了一种通过编程来提升大模型解决图分析推理任务能力的方法,并展示了在开源和闭源模型上进行实验的结果,使用新的基准数据集ProGraph验证了这一方法的有效性。
木易分享了Anthropic发布的Model Context Protocol(MCP)开源协议、Claude的自定义风格功能、月之暗面的新数学模型Kimi、OpenScholar科研助手模型发布以及xAI推出Grok独立应用程序等AI领域进展,强调这些创新将提升AI工具和应用的质量与效率。
具身智能是智能体与其环境的互动中展现的一种智能。近年来,其发展迅速,涵盖机器学习、人工智能等多个领域,并在多模态感知、自主决策等方面展现出强大能力。目前中国在该领域的研究和发展受到国家政策支持,在粤港澳大湾区尤为突出。未来还需解决技术及伦理安全等挑战。
木易分享国内首个开源推理模型QwQ-32B-preview的表现及其在基准测试中的优异成绩,并指出其局限性。该模型由阿里Qwen团队发布,参数仅有32B,适用于多种场景,但仍需优化安全性和连贯性等问题。
清华大学联合面壁智能团队提出新一代主动 Agent 交互范式,让 AI 成为具有’主观能动性’的智能助手。相比传统被动式 Agent,主动 Agent 能够根据上下文主动帮助用户。