全球首测!OpenAI开源SWELancer,大模型冲击100万年薪

专注AIGC领域的专业社区分享了OpenAI开源的SWE-Lancer测试基准,用于评估大模型处理真实开发任务的能力。该测试集包含1488个真实的开发任务,总价值达100万美元。SWE-Lancer采用端到端测试方法和用户工具来模拟真实场景,揭示了大模型在复杂软件工程任务中的局限性。

突发!大佬再就业,OpenAI前CTO Mira,Lilian Weng等成立「思考机器实验室」

OpenAI前CTO Mira宣布成立新公司Thinking Machines Lab,目标是让每个人都能用上最前沿的AI技术。团队成员来自知名AI产品与开源项目。核心方向包括以人为本的多模态协作、灵活定制和坚实基础等。