差评+翻车!Meta开源模型Llama 4被曝存在基准误导和黑幕,性能不如DeepSeek
Meta推出新模型Llama 4家族引发争议,实际测试成绩不及预期。相比DeepSeek等开源模型,在一些基准测试中表现出色,但在编码任务和长文写作方面表现不佳,引发网友质疑。
Meta推出新模型Llama 4家族引发争议,实际测试成绩不及预期。相比DeepSeek等开源模型,在一些基准测试中表现出色,但在编码任务和长文写作方面表现不佳,引发网友质疑。
作者|子川来源|AI先锋官新视觉语言模型Qwen2.5-VL-32B开源,相比72B规模更小但表现不俗。它在多个测试中击败了包括Gemma 3 27B在内的同尺寸模型。
新一周第一天,DeepSeek 发布了其开源版本 DeepSeek V3 模型的一次更新。模型体积为 6850 亿参数,并且在前端编码能力方面有所提升。
Claude 3.7 Sonnet作为首个混合推理模型,展示了强大的编码、物理模拟和生成游戏能力。上线几小时后就受到开发者追捧,能根据提示快速定制各种应用并击败了其他推理模型。