OpenAI
仅仅一天,Gemini就夺回了GPT-4o拿走的头名
谷歌和OpenAI在大模型领域竞争激烈,近期Google的Gemini-Exp-1114和Gemini-Exp-1121模型迅速更迭Top榜单。有人担忧当前的人工智能基准测试方法可能简化了模型评估,引发对安全性和可靠性等问题的关注。
速递 传闻OpenAI数据中心供应商,已获得6.86亿美元的新资金
Crusoe Energe,一家数据中心初创公司,根据SEC文件计划租赁给甲骨文、微软和OpenAI,已筹集8.18亿美元资金中的6.86亿美元。
全面进攻谷歌!OpenAI被曝打造浏览器,已挖Chrome创始大牛
OpenAI计划推出结合AI聊天机器人和浏览器的新产品,并且已经与多个网站进行了合作。此举被认为是对谷歌的挑战,可能会改变网络产品格局。
凑个热闹,测试一波DeepSeek新上的o1推理模型
MLNLP社区介绍了国内涌现的o1模型,并分享了一些测试结果。kimi的k0-math模型在数学和代码方面表现出色,但逻辑推理能力有待提高。社区呼吁开发者积极贡献开源模型,以超越OpenAI的技术水平。
OpenAI 这个意想不到的更新后, AI 拿捏了《再见爱人4》的发疯文学
OpenAI 更新了GPT-4o模型,提升了创意写作能力和处理上传文件的能力。GPT-4o能写科幻小说、古龙风格的小说以及脱口秀内容等。尽管在诗歌和歌词写作上还有待提升,但整体表现不错。OpenAI认为这将有助于改进人类使用模型的方式,并可能改变未来的内容创作方式。
OpenAI重夺竞技场第一,但这波靠的是4o
OpenAI开发者日新加坡站举行,新版ChatGPT发布。此版本更新了创意写作能力,并且在多项具体能力和综合排名中表现突出。新版本击败Gemini-Exp-1114和Claude 3.5 Sonnet等竞争者,总胜率达到72%以上。OpenAI还透露即将上线的o1满血版及其开源计划引发了网友们的关注与讨论。
登上“最不可能作弊”的榜单,阶跃星辰Step-2位列中国大模型第一|
阶跃星辰自研万亿参数语言大模型Step-2位列全球第五,成绩逼近OpenAI。其表现突出的IF Average指标超越了包括GPT-4在内的所有国内外模型。