跳至内容
每时AI

每时AI

  • 资讯
  • 国际
  • 分享
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 关于我们

Claude-3.5-Sonnet

OpenAI官方基准测试:承认Claude遥遥领先(狗头)

上午11时 2025/04/03 作者 量子位

OpenAI发布PaperBench新基准测试,最新版Claude-3.5-Sonnet在复现ICML2024论文任务中超越其他顶尖大模型。对比去年的MLE-Benchmark,PaperBench更侧重综合能力评估。

分类 资讯 标签 Claude-3.5-Sonnet、 o1-high、 OpenAI、 PaperBench、 凹非寺、 梦晨 发表评论

LangChain的官方博客发了一篇探索prompt优化的文章

下午11时 2025/02/02 作者 NLP工程化

文章评估了五种提示词优化方法,并推荐使用Claude-3.5-Sonnet模型,指出其在缺乏领域知识的任务中效果最佳。

分类 开源 标签 Claude-3.5-Sonnet、 Evolutionary optimization、 Few-shot prompting、 Meta-prompting、 Meta-prompting with reflection、 Prompt gradients 发表评论

原来,这些顶级大模型都是蒸馏的!

下午2时 2025/02/01 作者 Datawhale

Datawhale干货
大模型:蒸馏,整理:机器之心
「除了 Claude、豆包和 Gemini 之

分类 分享 标签 Claude-3.5-Sonnet、 DeepSeek-V3、 Doubao-Pro-32k、 GLM-4-Plus、 ICE、 Qwen-Max 发表评论

一人能顶一个公司:字节AI编程神器Trae诞生了!

上午8时 2025/01/23 作者 开源星探

2024年推出的中文友好的AI编程IDE Trae发布,支持实时建议、代码片段生成等功能,内置Claude-3.5-Sonnet免费聊天模型,简化了项目开发和日常编码过程,特别适合英语非母语开发者。

分类 开源 标签 AI问答助手、 Builder模式、 Claude-3.5-Sonnet、 Trae、 多模态交互、 字节跳动 发表评论

2025年 AGI AI AI技术 Anthropic ChatGPT Claude DeepSeek DeepSeek-R1 DeepSeek R1 GitHub GPT-4o LLM Manus Meta OpenAI Python Sam Altman 人工智能 人形机器人 具身智能 大型语言模型 大模型 大语言模型 字节跳动 开源 强化学习 微软 扩散模型 技术创新 智能体 木易 机器学习 深度学习 清华大学 生成式AI 用户体验 百度 腾讯 自然语言处理 英伟达 谷歌 阿里云 阿里巴巴 马斯克

近期文章

  • 对话即界面!微软NLWeb开源:任何网站都能‘一键变身’智能AI助手
  • 花钱给论文降“AI味儿”,灰色产业链盯上毕业生
  • 对话实录整理:从Lovart看AI对设计行业的影响
  • 吴恩达:与其争论“是不是”智能体,不如关注智能化程度
  • 关于Agent在实际开发过程中遇到的问题记录

分类

  • 分享
  • 国际
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 资讯
2025 年 5 月
一 二 三 四 五 六 日
 1234
567891011
12131415161718
19202122232425
262728293031  
« 4 月    

归档

  • 2025 年 5 月
  • 2025 年 4 月
  • 2025 年 3 月
  • 2025 年 2 月
  • 2025 年 1 月
  • 2024 年 12 月
  • 2024 年 11 月

AI新闻 | X平台 | APK反编译 | 京ICP备2024096144号 |
© 2025 每时AI • Built with GeneratePress
 下载我们的APP,AI秒送达!  立即下载
×