Perplexity发布Sonar API,一举超越所有搜索引擎和LLM
Perplexity发布了Sonar API,这个颠覆性的产品不仅是最便宜的搜索API之一,还能提供实时信息检索能力。Sonar提供了基础版和Pro版本满足不同需求。最新SimpleQA基准测试中,Sonar Pro在答案质量上超越了主流搜索引擎和LLM。
Perplexity发布了Sonar API,这个颠覆性的产品不仅是最便宜的搜索API之一,还能提供实时信息检索能力。Sonar提供了基础版和Pro版本满足不同需求。最新SimpleQA基准测试中,Sonar Pro在答案质量上超越了主流搜索引擎和LLM。
OpenAI宣布投资5000亿美元建设全新AI基础设施,软银、Oracle等参与。项目包括GPU仓库和下一代芯片工厂等技术合作。但也有质疑声音认为这是权力攫取。
Anthropic分享了与多家团队合作开发AI Agent的经验。他们发现最成功的实现往往使用简单、可组合的模式,并计划在2025年推出能自主操作电脑、编写代码的虚拟协作者。Anthropic定义了两种Agent系统:工作流和Agent。建议优先使用简单的方案,只有必要时才考虑Agent系统。
一个名为Virtual Collaborator的AI代理计划在2025年推出,该数字员工能够独立执行多种任务,如编写代码、通过Slack与同事沟通,并定期汇报进度。Anthropic强调其安全性和可控性。
Perplexity CEO Aravind Srinivas批评印度在基础模型训练上的重复错误,并指出低成本创新在印度AI领域的重要性。多位印度创业者认同这一观点,认为印度具备成为全球用例之都的潜力。然而,美国科技巨头的游说者们却试图阻止这样的发展。
DeepSeek AI 推出 DeepSeek-R1 模型,引入群体相对策略优化(GRPO)和多阶段训练方法。通过强化学习提升大语言模型推理能力,并在监督微调和拒绝采样后形成最终模型。
一台超级计算机被塞进了行李箱大小的公文包里。GigaIO和SourceCode联手打造的便携式AI超级计算机Gryf能在任何地方部署AI超算级别的算力,并且拥有模块化设计、强大的散热设计等特点,能支持PB级别数据集处理和现场直接将大量传感器数据转化为可行解决方案。
网页抓取终于告别编程时代!Firecrawl推出革命性的/extract功能,只需简单提示词就能将网站转化为结构化数据。它支持批量联系人抓取、数据集构建、信息富集、实时监控等功能,并提供多语言和自动化集成能力。
在数学竞赛AIME测试中,Qwen-1.5B模型以28.9%的成绩击败了GPT-4和Claude 3.5-Sonnet。仅1.5B参数量的它,在MATH测试中取得83.9%成绩。DeepSeek团队采用知识蒸馏技术成功将大模型智慧浓缩进更小的模型,MIT许可下开源多个版本。
OpenAI新增网站信息显示Operator系统在多项基准测试中表现出色,包括文本编辑和命令行操作,在无辅助模式下达到87.5%准确率,安全上拒绝潜在危险指令98.2%,引发广泛关注。