速递|OpenAI发布GPT-4.5模型,旨在提升写作与编程能力
OpenAI推出新模型GPT-4.5,改进了捕捉和回应用户提示细微线索的能力,在聊天、写作和编码方面表现更佳。该模型预计虚构内容的频率将降低,最初作为’研究预览’提供给订阅ChatGPT Pro的用户,有望在广泛受众中进一步完善。
OpenAI推出新模型GPT-4.5,改进了捕捉和回应用户提示细微线索的能力,在聊天、写作和编码方面表现更佳。该模型预计虚构内容的频率将降低,最初作为’研究预览’提供给订阅ChatGPT Pro的用户,有望在广泛受众中进一步完善。
Thinking Machines Lab,由前OpenAI首席技术官Mira Murati创立的消息传出,该公司正与潜在投资者洽谈,计划筹集约10亿美元资金。
Figure机器人初创公司计划于2025年晚些时候开始在家居环境中对其人形机器人进行‘alpha测试’,得益于名为Helix的通用型视觉-语言-行动(VLA)模型。
Truffle Security发现DeepSeek训练数据中包含约12000个活跃API密钥和密码,分布在400TB的网络数据中。研究揭示大语言模型可能在无意中学习并复制不安全的编码实践。
DeepSeek开源周结束,公布了V3和R1训练推理过程中使用的Fire-Flyer文件系统(简称3FS)和Smallpond数据处理框架。3FS利用现代SSD和RDMA网络性能,实现了惊人的读取吞吐量。
上海交通大学张林峰团队提出Toca方法,通过token粒度的缓存策略实现无需训练的图像和视频生成加速,相比现有方法具有更强适配性和优异性能。