跳至内容
每时AI

每时AI

  • 资讯
  • 国际
  • 分享
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 关于我们

数学

DeepSeek V3获竞技场最强开源认证!与Claude 3.5 Sonnet对比实测来了

下午4时 2024/12/31 作者 量子位

国产模型DeepSeek V3在竞技场中表现优异,但在部分逻辑陷阱问题上略逊一筹。量子位进行了实测对比,发现Claude 3.5 Sonnet在理解某些脑筋急转弯和弱智吧问题上更为精准。

分类 资讯 标签 DeepSeek V3、 o1-mini、 写作、 开源模型、 数学、 编程 发表评论

o1 pro深评博士医学论文,震惊顶尖免疫学家!2分破解神秘作家身份

下午2时 2024/12/29 作者 新智元

OpenAI发布o1 pro,震惊免疫学专家Derya Unutmaz。o1 pro评估论文后揭示深厚见解,涵盖数理化与人文社科领域。

分类 资讯 标签 Derya Unutmaz、 o1 Pro、 OpenAI、 数学、 科学、 编程 发表评论

谷歌版o1来了:思考速度比所有模型快5倍,水平堪比理科博士

上午10时 2024/12/20 作者 Founder Park

谷歌发布Gemini 2.0 Flash Thinking模型,能在几秒钟内解决复杂问题并展示思考过程。它支持多种数据类型和推理,并能与图像、文本等结合处理。性能超越OpenAI的o1系列。

分类 资讯 标签 32000、 人工智能模型Gemini 2.0 Flash Thinking、 数学、 网友实测、 视觉类谜题、 谷歌 发表评论

月之暗面发布 k1 模型:不只是看到,更要看懂

下午10时 2024/12/16 作者 毫河风报

月之暗面发布的视觉思考模型 k1,基于强化学习技术实现了端到端的图像理解与思维链技术,在数学、物理等基础科学学科的基准测试中表现优异。

分类 资讯 标签 Fish、 k1 模型、 OpenAI、 强化学习技术、 数学、 月之暗面团队 发表评论

阿里重磅开源QwQ-32B:自我思考、纠正,数学能力击败o1模型

上午9时 2024/11/28 作者 AIGC开放社区

阿里巴巴开源新模型QwQ-32B,在数学和编程测试中表现出色,但在语言切换和复杂推理方面仍有提升空间。

分类 资讯 标签 50、 QwQ-32B、 代码、 大语言模型(LLM)、 数学、 阿里巴巴 发表评论
较新文章
← 上一页 页面1 页面2

2025年 AGI AI AI技术 Anthropic ChatGPT Claude DeepSeek DeepSeek-R1 DeepSeek R1 GitHub GPT-4o LLM Manus Meta OpenAI Python Sam Altman 人工智能 人形机器人 具身智能 大型语言模型 大模型 大语言模型 字节跳动 开源 强化学习 微软 扩散模型 技术创新 智能体 木易 机器学习 深度学习 清华大学 生成式AI 用户体验 百度 腾讯 自然语言处理 英伟达 谷歌 阿里云 阿里巴巴 马斯克

近期文章

  • 从打分器到思考者:RM-R1用推理重塑模型价值判断
  • SSM+扩散模型,竟造出一种全新的「视频世界模型」
  • 250美元起售,还开源,Hugging Face 发布史上最亲民人形机器人
  • 一周两破18年数学纪录!陶哲轩惊叹:AlphaEvolve带来久违「加速度」
  • 大模型推理的“左右脑”革命!华为盘古Embedded凭昇腾之力,让快慢思考合二为一

分类

  • 分享
  • 国际
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 资讯
2025 年 6 月
一 二 三 四 五 六 日
 1
2345678
9101112131415
16171819202122
23242526272829
30  
« 5 月    

归档

  • 2025 年 5 月
  • 2025 年 4 月
  • 2025 年 3 月
  • 2025 年 2 月
  • 2025 年 1 月
  • 2024 年 12 月
  • 2024 年 11 月

AI新闻 | X平台 | APK反编译 | 京ICP备2024096144号 |
© 2025 每时AI • Built with GeneratePress
 下载我们的APP,AI秒送达!  立即下载
×