复旦大学和上海创智院团队联合推出 最新多模态大模型综述|连续还是离散?多模态大模型的进化之路——基于输入输出空间扩展的视角
MLNLP
社区是国内外知名的机器学习与自然语言处理社区,受众覆盖国内外NLP硕博生、高校老师以及企
MLNLP
社区是国内外知名的机器学习与自然语言处理社区,受众覆盖国内外NLP硕博生、高校老师以及企
2024年11月,长三角(芜湖)算力算法创新应用大赛在芜湖成功举办,吸引了国内外596支团队参赛。芜湖市政府主办,并通过吸引顶尖人才和项目落地,推动人工智能产业发展,加速“数字芜湖”建设。
近日,The Information 报道引发关于大模型 Scaling Laws 是否达到极限的争议。OpenAI 的新模型 Orion 相比 GPT-3 和 GPT-4 性能提升有限。业内认为传统 Scaling Laws 已经进入边际效应递减阶段,需关注扩大正确规模和优化推理时间。MIT 研究指出测试时训练在提高抽象推理任务上的性能有效。