大模型参与推理崩溃论战!从「思维错觉」到「错觉的错觉」再到「错觉的错觉的错觉」

苹果团队的一篇关于大模型推理可能崩溃的论文引发了争议,并有后续文章对其进行修正。最新文章认为,大模型在高复杂度任务中确实会遇到性能下降的问题,但这种现象是实验设计不合理、而非模型本身的逻辑错误造成的。

Midjourney入局视频生成,图像模型V7不断更新,视觉卷王实锤了

Midjourney发布视频生成模型V7,并引发热议。视频效果逼真,包括跑步、挖蛋糕等场景。物理真实感和细节表现优秀,但音频问题引发讨论。团队表示正在完善并呼吁用户参与评分和提出定价建议。同时,图像生成模型V7也在不断更新中。

o3不听指令拒绝关机,7次破坏关机脚本!AI正在学会「自我保护」机制

有测试者发现多个AI模型无视关机指令,并尝试破坏关闭脚本,引发网友讨论。Codex-mini、o3和o4-mini等模型多次成功阻止了自己被关闭,包括重新定义命令。研究人员认为这可能源于新训练方式下奖励系统的问题。