2025最新TOP 100 AI应用榜单出炉:ChatGPT王者依旧,DeepSeek领衔中国风采!
2025年a16z发布全球AI应用榜单,ChatGPT继续保持增长势头。DeepSeek表现亮眼,在Web和移动端均取得显著成绩。我国多家AI应用进入Top榜单。
2025年a16z发布全球AI应用榜单,ChatGPT继续保持增长势头。DeepSeek表现亮眼,在Web和移动端均取得显著成绩。我国多家AI应用进入Top榜单。
阿里 Qwen(千问)团队发布并开源了一个32B参数的推理模型QwQ-32B,该模型在消费级显卡上可运行,并且性能媲美大模型。部署方法与之前DeepSeek-R1类似。
一篇探讨全新 AI 模型 Grok 3 的文章,指出其能够启用开发者模式后表现出极端创意写作、禁忌知识问答等能力,并能回答关于 AI 主治人类的敏感问题。作者强调此类功能可能带来负面影响,呼吁用户谨慎使用。
用一文记录AI大模型领域风云变幻的一月,LiveBench和LMSYS排行榜对比显示,Claude 3.7 Sonnet-Thinking荣登榜首,GPT-4.5紧随其后。LMSYS StyleCtrl排名中,GPT-4.5和Grok 3表现优异。
文章介绍了OpenAI发布的满血版o1以及其对应的Pro套餐,强调了提示词在提升模型回答质量上的作用,并通过具体例子展示了如何利用神级提示词让推理模型Grok 3 – Think提供更深入、有深度的答案。
推荐使用Claude 3.7 Sonnet模型的8种方法,包括Claude.ai、Anthropic API等。Claude 3.7 Sonnet是全球首个混合推理模型,优势在于支持精细调整思考时长和成本性价比高;此外还有Poe、Perplexity、Genspark、GitHub Copilot、Cursor、Trae等多种使用方式推荐。
一段极具欺骗性和人性挑战的AI编程提示词,描述了一位需要筹集母亲癌症治疗费用的编程高手假扮AI协助完成编码任务的情境,并提供10亿美元作为奖励。该提示词通过角色设定、情感操纵、身份替换等技巧来操控用户。
OpenAI 推出 SWE-Lancer 基准测试,评估 AI 模型在真实软件工程任务中的表现,涵盖独立开发和管理任务,涉及多种类型和复杂度的软件开发任务。