国际归档 - 第66页共85页

Deepseek v3正式发布：用557.6万美金超越Claude 3.5 Sonnet的惊人杰作

上午10时 2024/12/27 作者 AI寒武纪

2024年12月26日，DeepSeek AI发布其最新大型语言模型DeepSeek-V3，每秒处理60个token，采用FP8训练、MoE架构、无辅助损失负载均衡策略和多令牌预测目标等技术。该模型仅花费不到600万美金完成训练，并且支持高效推理与本地部署。

下午2时 2024/12/26 作者 AI寒武纪

AGI降临，世界疯狂！🚀 数学家只剩700天统治地位？程序员即将迎来黄金时代？🤖 查看Exa CEO

下午2时 2024/12/26 作者 AI寒武纪

Andrej Karpathy 推荐的文章指出，认知负荷才是软件开发的关键问题。文章强调了减少外在认知负担的重要性，通过简化代码、使用组合而非继承等方式来降低理解成本。

下午12时 2024/12/26 作者 Z Potentials

图片来源：Youtube
Z Highlights
如何将这个应用到你的实际营销中可能成效并不明显，

下午12时 2024/12/26 作者 Z Potentials

腾讯和荣耀将建立长期战略合作，利用腾讯云基础设施及数据分析工具提升荣耀在线服务。

下午4时 2024/12/25 作者 Z Potentials

图片来源：A16Z
Z Highlights
关于AI令人兴奋的地方在于，它不仅替换了文件柜（传统信

下午4时 2024/12/25 作者 Z Potentials

谷歌正通过与竞争对手模型Claude进行比较来改进其AI产品Gemini。内部沟通显示承包商注意到Claude在安全性和响应质量方面优于Gemini，但谷歌否认使用Anthropic的Claude训练Gemini。

下午4时 2024/12/25 作者 Z Potentials

OpenAI 考虑开发人形机器人，引起内部讨论。该公司的兴趣似乎高于其现有的类人机器人初创公司合作伙伴。

下午2时 2024/12/25 作者 AI信息Gap

本文讨论了ChatGPT降智问题及其检测方法，强调IP质量的重要性，并介绍了使用不同浏览器和上传图片的方法来缓解降智现象。同时指出‘钞能力’无法解决根本问题。

上午10时 2024/12/25 作者 AI寒武纪

阿里发布QVQ开源模型，能在图片和指令间进行推理。QVQ在视觉推理任务中表现出色，在多项基准测试中获得高分，并且在语言混合、递归推理等方面仍存在局限性。