字节 DAPO 技术报告有感!大模型 RL 细节为王
近期,清华发表的DAPO将32b-base做到了AIME 50分的效果。报告中提到动态采样、sft和rl策略对比等方法,并强调了良好流程的重要性。
近期,清华发表的DAPO将32b-base做到了AIME 50分的效果。报告中提到动态采样、sft和rl策略对比等方法,并强调了良好流程的重要性。
Runway发布Gen4模型后,作者对其画饼多、实际效果一般表示质疑。Gen4主打多主体参考功能,但在关键细节如光影、人物动作等方面存在不足。对比可灵1.6等其他模型,Gen4在图生视频方面表现欠佳。
OpenAI 最新开源大语言模型,包括参数权重;完成400亿美元融资;ChatGPT用户增速创下纪录。这是继GPT-2之后的又一重大动作。
直接愣住了
Sam Altman大大自己在X上亲自宣布了:
「
我们几个月内就会发布一款强大的开源语
清华大学团队提出YOLOE模型,实现了开放物体探测与分割。该模型基于YOLO架构改进,具备多模态能力,能听懂语言指令、看懂图像,并自主发现新事物。HyperAI超神经平台上线了详细的部署教程。
智谱发布全球首个通用Agent产品AutoGLM沉思,不仅能思考还能实时操作浏览器。通过’先思考再执行’策略和强大的技术栈,AutoGLM沉思能完成复杂的任务并提供详细报告。它已在三个实际场景中被测试,并且在信息获取方面表现出色,但处理速度较慢。