DeepSeek V3 归档 - 每时AI

腾讯的Cursor–CodeBuddy深度评测-从代码生成到多文件协作生成的AI开发工具评测

2025年5月13日14时作者老刘说NLP

编码智能体Craft通过「需求-拆解-执行-验证」流程实现复杂工程任务，支持从需求到多文件代码生成、重构的全流程自主化开发，并提供MCP生态整合能力及Plan模式辅助用户完成任务。对比Cursor Agent，Craft在多个方面表现出色，支持多文件系统级改造，具备更好的用户体验和计划功能，是开发者值得考虑的选择。

欧洲黑马Mistral Medium 3来了！跑分对标最强Claude，实测大翻车

2025年5月8日11时作者新智元

法国初创Mistral发布其最新多模态模型Mistral Medium 3，性能接近甚至达到Claude Sonnet 3.7的水平，但成本仅为DeepSeek V3的八分之一。

图解DeepSeek V3 biased_grouped_topk cuda融合算子fused_moe_gate kernel

2025年4月14日19时作者 GiantPandaCV

thub.com/sgl-project/sglang/blob/main/python/sglan

Llama 4多模态大模型上线即开源，测试成绩、开源模式广遭质疑

2025年4月8日14时作者 AI先锋官

Meta发布首个原生多模态Llama 4系列模型，性能超越GPT-4。包含Maverick、Scout和Behemoth三个模型，支持1000万token上下文。不过其开源模式存在争议，包括登录Hugging Face账户限制、严格再分发要求及命名要求等。

强推理模型下，Agent workflow 仍有必要吗？

2025年3月30日11时作者机器之心

本周解读了两则关于AI及机器人领域的业内重要事件。一是探讨强推理模型下，Agent workflow是否仍有必要；二是分析从‘拼能力’到‘拼盈利’的视频生成赛道格局变化。