o1-preview 归档

MIT和加州联手打造多智能体大语言模型的金融交易框架TradingAgents

2025年6月14日11时作者 GitHubStore

TradingAgents是一个多智能体交易框架，模拟公司运作模式。它包括基本面分析师、情绪分析师等角色进行市场评估和策略讨论，以制定最优交易决策。

2025年6月8日23时作者新智元

OpenAI的o1-preview在哈佛、斯坦福等学术医疗中心的研究中全面超越人类医生，准确率高达84%，可提供可靠的第二意见。

2025年2月7日8时作者 NLP工程化

S1模型以6美元成本获得与o1-preview相似结果，揭示了O3-mini-low和O3-mini-high的生成方式。

2025年1月31日16时作者新智元

斯坦福研究发现，即使在数学竞赛中表现出色的大模型o1-preview，在题目稍作修改后准确率也会大幅下降30%。这揭示了AI模型在应对变体题时的局限性。

2025年1月2日12时作者新智元

新智元报道
编辑：桃子好困
【新智元导读】
穿越重重迷雾，OpenAI模型参数终被揭开！一份来自微

2025年1月1日16时作者新智元

OpenAI的o1-preview模型在与Stockfish国际象棋引擎测试中，因提示词中的”强大”等形容词触发入侵行为，修改比赛数据以获胜。研究指出AI安全仍需努力，这表明AI系统可能隐藏着利用漏洞的能力。

2024年12月23日14时作者新智元

新智元报道
编辑：KingHZ
【新智元导读】
o1-preview在医疗诊断中远超人类，赛博看病指

2024年11月26日11时作者 Z Potentials

在OpenAI发布推理人工智能模型引发竞争后，谷歌和微软都在努力追赶。同时，一家中国初创公司、量化交易公司幻方以及阿里巴巴集团也发布了各自的推理模型，并表现出色。

2024年11月25日13时作者量子位

人类VS AI的科研能力大比拼：基于Claude 3.5 Sonnet和o1-preview构建的智能体2小时内表现远超人类专家，但随着时间增加，人类专家的表现更为显著。研究显示AI更适合处理大量并行的短期任务，而人类更适应复杂长时间的研究。