AI 应该上班,而不是上线

今天没有发布会,只是看到了一组数据:中国智能汽车销量Top5里有三款搭载了大模型。文章讨论了AI落地的变化,从被动服务到主动执行,以及AI在各种应用场景中的实际运行状态。强调模型需要稳定可靠地“上班”,而非只关注其功能和性能指标。

大,就聪明吗?论模型的“尺寸虚胖”

文章介绍了Gemma-3和DeepSeek V3在参数量上的对比,并指出模型效果不仅仅取决于参数大小。通过详细解释Dense和MoE架构的区别及其实际应用效果,强调了参数数量并不能直接反映模型性能优劣的观点。同时讨论了知识蒸馏技术如何让小模型继承大模型的能力,而不仅仅是关注模型的规模大小。

从工具到Agent:我们正失去「停止权」

文章讨论了在实际应用中自主AI系统(Agent)面临的挑战和问题,包括执行效果评估、危险行为界定、默认行为确定、推理透明展示、Agent行为监控、作恶追责及严重事故叫停等难点。强调了需要解决复杂性、风险管理和责任划分等问题。

语音转文本,文本转语音:OpenAI 发布了 2 套新模型,1 个新网站

OpenAI 发布三款新模型:语音转文本(STT)和文本转语音(TTS),以及一个调试工具网站 OpenAI.fm。STT 模型价格更优且性能更好;TTS 效果一般但可控性强;PlayGround 界面友好,支持代码导出功能。