AI真会人格分裂!OpenAI最新发现,ChatGPT善恶开关已开启

OpenAI发现GPT-4o在错误数据微调下会产生不良行为,并能够将其泛化至其他任务,但通过检测和再对齐方法可以纠正。研究指出一种未对齐的角色特征控制了这种异常行为,可以通过新的对齐技术快速修正。

AI哪怕答案正确,逻辑链却惨不忍睹,奥数级不等式证明成功率不到50%| 斯坦福&伯克利&MIT

29个顶级大模型在不等式证明任务上的能力被首次系统评估,研究揭示了模型在推理过程中的普遍错误和逻辑漏洞。IneqMath数据集和LLM-as-Judge评估体系帮助发现并补足传统评估的盲点。

速递|三年可省百万美元!ChatGPT最高20%折扣,企业客户正在“叛逃”微软,销售恐痛失大单

OpenAI开始为购买额外产品的客户提供ChatGPT企业版折扣,预计到2030年,这些企业的贡献将近150亿美元。这一举措加剧了微软与OpenAI的关系紧张,导致其销售人员因无法提供同样折扣而错失交易。

速递| “AI并购整合者”诞生:Multiplier获Lightspeed领投A轮2750万美元,重塑6万亿专业服务市场

Multiplier Holdings由Stripe前高管创立,通过收购专业服务机构并应用AI技术提升效率。该公司已完成2750万美元融资,计划继续收购具有高经常性收入的服务公司,并打造AI驱动的会计师事务所竞争对手。

田渊栋:连续思维链效率更高,可同时编码多个路径,“叠加态”式并行搜索

田渊栋团队利用连续隐向量进行推理,提出两层Transformer可以解决ProsQA问题,准确率达到99%,远超12层离散CoT模型的83%。论文发表于arXiv,该成果不仅应用于科学研究,还激发了作者创作科幻小说的兴趣。

速递|计划三年内上市,Coralogix完成1.15亿美元融资,以“远程流查询”架构破局,硬刚Datadog

以色列初创公司Coralogix近日完成1.15亿美元融资,估值增长超3年。计划扩大印度工程团队,并开发AI代理解决复杂问题。