日期: 2024 年 11 月 27 日
AI造芯Nature论文遭围攻,谷歌发文硬刚学术抹黑!Jeff Dean怒怼:你们连模型都没训
谷歌首席科学家Jeff Dean回应EDA社区对AlphaChip的质疑,指出多个实验数据存在缺陷,并强调了预训练、计算资源和收敛训练的重要性。
钛媒体独家|突发!360公司上线“纳米搜索”App,周鸿祎将与百度上演“AI 搜索大战”
360公司创始人周鸿祎透露,其研发的AI搜索产品‘纳米搜索’已上线应用商店。主打集搜、读、写、创于一体,并声称要重新定义AI搜索,轻便快捷且支持多种方式操作。
清华量子计算成果登顶刊,首次发现噪声影响量子优势,来自丘成桐数学中心团队
清华大学魏朝晖团队发现噪声可导致量子优势突然消失的现象,并首次将其发表于Science Advances。研究揭示了量子信息处理中噪声对量子计算性能的显著影响,为量子纠错机制的应用提供了指导。
1行代码改进大模型训练,Llama训练速度提升至1.47倍,全华人团队出品
研究人员提出Cautious Optimizers优化器,在不损害训练效果的情况下提升了大模型的训练效率47%,该优化器已在GitHub上开源。它通过引入掩蔽机制来避免参数更新方向与当前梯度方向相悖,从而加速了训练过程并保持了收敛特性。
遗憾不?原来百度2017年就研究过Scaling Law,连Anthropic CEO灵感都来自百度
机器之心报道
机器之心编辑部
原来早在 2017 年,百度就进行过 Scaling Law 的相关研