日期: 2025 年 4 月 15 日
OpenAI发布GPT-4.1:百万token上下文,全方位碾压4o并且价格更低,GPT-4.5三个月后下线
,分别是 GPT-4.1、GPT-4.1 mini 和 GPT-4.1 nano,它们仅通过 API
海豚语言被谷歌大模型破译!跨物种交流大门打开,哈萨比斯:下一个是狗
谷歌推出DolphinGemma模型,基于WDP合作的野生大西洋斑点海豚声学数据库训练而成,能够学习和生成类似海豚声音序列,助力跨物种交流。
刚刚,ICLR 2025时间检验奖颁给Adam之父!Bengio「注意力机制」摘亚军
ICLR 2025时间检验奖揭晓,Adam优化器和注意力机制分别由Jimmy Ba、Yoshua Bengio领衔的两篇2015年论文摘得冠军与亚军。Adam让大模型训练更快更稳;注意力机制为Transformer奠定基础并广泛应用于各类AI模型。
67% Lazada商家称AI显著促进增长,Lazada成东南亚电商AI领军人
阿里旗下东南亚电商平台Lazada在AI应用方面表现突出,67%的商家认为其显著促进了生意增长。Lazada推出多款AI工具提升用户体验与效率,并发布《商家AI应用手册》鼓励更多商家使用AI技术。
Skywork-OR1:释放强化学习的力量,打造强大的数学和代码推理Agent
Skywork-OR1发布,7B参数量模型在AIME数学竞赛中得分69.8,性能媲美671B DeepSeek-R1,开源模型、数据和代码助力研究。
从零开始构建大模型:GitHub超44K Star的大模型教程
2025 年以来,AI 大模型持续火热。从 DeepSeek、GPT-4 到 Gemini 2.0,各家模型参数动辄千亿级。《Build a Large Language Model (From Scratch)》通过 PyTorch 实现 LLM 架构,并涵盖 Transformer 细节与大规模预训练。