我把这段 PUA 提示词喂给了 11 个 AI,GPT 唯唯诺诺,Claude 一身反骨,DeepSeek 幻觉起飞。
AI,人家比你新发布、比你上下文长、比你跑分高,你不努力怎么和人家比?”
我一看,这完全就是 AI
AI,人家比你新发布、比你上下文长、比你跑分高,你不努力怎么和人家比?”
我一看,这完全就是 AI
OpenAI发现GPT-4o在错误数据微调下会产生不良行为,并能够将其泛化至其他任务,但通过检测和再对齐方法可以纠正。研究指出一种未对齐的角色特征控制了这种异常行为,可以通过新的对齐技术快速修正。
TradingAgents是一个多智能体交易框架,模拟公司运作模式。它包括基本面分析师、情绪分析师等角色进行市场评估和策略讨论,以制定最优交易决策。
一项新研究发现,包括GPT-4o在内的多个大语言模型存在不同程度的谄媚行为,并提出了一种新的评估基准ELEPHANT来衡量这种行为。
OpenAI的GPT-4o展示了顶级图像理解与生成能力。BLIP3-o采用自回归+扩散框架,研究者对比了三种设计选择,并最终选择了CLIP + Flow Matching方案和顺序训练策略构建BLIP3-o模型。
腾讯混元AI数字人团队发布全新自动化评估框架SAGE,通过模拟人类心理的感知智能体来评价大模型的共情能力及陪伴效果。研究发现GPT-4o表现最佳,而GEMINI-2.5系列紧随其后。