资讯
国际
分享
大模型
学术
开源
机器人
关于我们

事实查找

OpenAI放大招！BrowseComp来了，AI上网能力大比拼！

上午11时 2025/04/11 作者 AGI Hunt

OpenAI发布了全新基准测试BrowseComp，专为评估AI代理在互联网上寻找难以获取信息的能力而设计。该测试包含1266个难题，其中大多数人类也需要花费两小时才能解决。

分类分享标签 BrowseComp、 Deep Research、 GPT-4o+、 OpenAI、两小时、事实查找发表评论

搜索

AGI AI AI技术 Anthropic ChatGPT Claude DeepSeek DeepSeek-R1 DeepSeek R1 GitHub GPT-4o LLM Manus MCP Meta OpenAI Python Sam Altman 人工智能人形机器人具身智能大型语言模型大模型大语言模型字节跳动开源强化学习微软扩散模型技术创新智能体木易机器学习深度学习清华大学生成式AI 用户体验百度腾讯自然语言处理英伟达谷歌阿里云阿里巴巴马斯克

近期文章

乐动机器人冲击港股上市
ICML 2025 北大团队提出GAPrompt：仅用2%参数，点云模型精度媲美全量微调
本末科技完成数亿元B轮及B+轮融资，加速机器人与直驱技术产业化落地
特朗普威胁砍合同，马斯克要关闭龙飞船？NASA 或将陷入绝境
为何钟情于机器人炫技？王兴兴：展示技术现状，释放商业价值｜快讯

分类

分享
国际
大模型
学术
开源
机器人
资讯

2025 年 6 月
一	二	三	四	五	六	日
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30

« 5 月

归档

2025 年 6 月
2025 年 5 月
2025 年 4 月
2025 年 3 月
2025 年 2 月
2025 年 1 月
2024 年 12 月
2024 年 11 月

AI新闻 | X平台｜ APK反编译｜京ICP备2024096144号｜

© 2025 每时AI • Built with GeneratePress

下载我们的APP，AI秒送达！立即下载

×