阿里、中科大等提出ExecRepoBench:仓库级可执行代码补全新基准
本文提出ExecRepoBench,一个面向仓库级代码补全的新测试基准,并设计了基于抽象语法树的多层次代码遮掩方法用于构造指令微调数据集Repo-Instruct。基于该数据集训练的Qwen2.5-Coder-Instruct-C模型在多项基准测试中表现优异。
本文提出ExecRepoBench,一个面向仓库级代码补全的新测试基准,并设计了基于抽象语法树的多层次代码遮掩方法用于构造指令微调数据集Repo-Instruct。基于该数据集训练的Qwen2.5-Coder-Instruct-C模型在多项基准测试中表现优异。
你敢信,如今的AI智能到‘碉堡’了。从文本生成、图像生成到视频生成、数学推理及视觉思考,它们不断升级。Kimi最新发布的k1模型能识别多种生活场景并提供帮助,如房树人分析、洗衣机功能指导等。它还能根据图片或网页截图编写代码,并解决复杂数独题。这款助手功能全面,使用简单。
本文提出了一种新的大规模跨域行人属性识别数据集MSP60K,以及一种名为LLM-PAR的大语言模型增强框架用于提升行人属性识别的准确性。
Sam Altman发布了新的一年技术愿景,并在社交平台上征求网友的意见。文中提到一些基本确定的技术路线及好的意见,如更强的GPT-4o替换品、50/70美元的价格区间模型、更长的上下文窗口等。
虚拟动点在’当’空间计算遇上’具身智能’暨技术成果发布日上展示了人形机器人的能力。公司通过OptiTrack光学定位算法和LYDIA动作大模型等技术,实现了机器人具备感知、决策与控制动作的能力,并宣布与松延动力成立联合实验室。