赛博禅心
Llama 4 发布:我看到了 DeepSeek 的影子
Llama 4 发布三款模型:Scout、Maverick 和 Behemoth。参数量分别为109B、400B和2T;Maverick 在多项任务上超越GPT-4,并且推理成本仅为其十分之一。
AI 应该上班,而不是上线
今天没有发布会,只是看到了一组数据:中国智能汽车销量Top5里有三款搭载了大模型。文章讨论了AI落地的变化,从被动服务到主动执行,以及AI在各种应用场景中的实际运行状态。强调模型需要稳定可靠地“上班”,而非只关注其功能和性能指标。
大,就聪明吗?论模型的“尺寸虚胖”
文章介绍了Gemma-3和DeepSeek V3在参数量上的对比,并指出模型效果不仅仅取决于参数大小。通过详细解释Dense和MoE架构的区别及其实际应用效果,强调了参数数量并不能直接反映模型性能优劣的观点。同时讨论了知识蒸馏技术如何让小模型继承大模型的能力,而不仅仅是关注模型的规模大小。
从工具到Agent:我们正失去「停止权」
文章讨论了在实际应用中自主AI系统(Agent)面临的挑战和问题,包括执行效果评估、危险行为界定、默认行为确定、推理透明展示、Agent行为监控、作恶追责及严重事故叫停等难点。强调了需要解决复杂性、风险管理和责任划分等问题。
GPT-4o 生图实测:很强(附:20+场景示例 & 缺陷整理)
ChatGPT通过4o模型发布新功能,能够生成高质量图像,并根据对话进行修改。它能处理复杂的场景、风格多样且指令遵循能力强。然而,也存在一些限制和潜在问题。
语音转文本,文本转语音:OpenAI 发布了 2 套新模型,1 个新网站
OpenAI 发布三款新模型:语音转文本(STT)和文本转语音(TTS),以及一个调试工具网站 OpenAI.fm。STT 模型价格更优且性能更好;TTS 效果一般但可控性强;PlayGround 界面友好,支持代码导出功能。