日期: 2025 年 5 月 24 日
字节把GPT-4o级图像生成能力开源了!
字节跳动最新发布BAGEL模型,融合图像理解、生成、编辑等多种功能,参数规模只有7B,但表现超越或媲美众多顶级开源和闭源模型。通过MoT架构实现统一多模态能力,并在Hugging Face上架开源。
矩阵乘法新突破!XX^T原来可以更快!RL助力搜索,世界纪录又被提升了5%
深圳市大数据研究院与香港中文大学研究团队发现一种新的算法,通过减少特定矩阵乘法的运算量来节省5%的能量消耗。该成果引起国际专家关注,并对多个实际应用领域带来优化潜力。
ChatGPT引爆教育革命,学习效果暴涨86.7%!
一项元分析研究显示,ChatGPT显著提升了中小学生的学习表现和高阶思维能力。研究成果基于对59项研究的汇总发现,使用大模型后学生的学习成绩提升0.867个标准差,高阶思维能力提升0.457个标准差,并减轻了学生的压力。
40位数学家组成8队与o4-mini-medium比赛,6队败北
在FrontierMath基准测试中,O4-mini-medium击败了由数学专家组成的团队。尽管AI尚未达到超人水平,但有观点认为它很快就会超越人类。
GraphRAG的两个有趣疑问及LLM代表开源开发工具总结
2025年5月24日周六,北京晴天。本文讨论了GraphRAG的两个问题和大模型开源生态全景图的主要研发工具。GraphRAG技术适用于特定场景而非特定领域;而信息抽取任务更适合专门的任务模型。此外,总结期的大模型开源生态强调关键技术和代表项目。