精度与通用性不可兼得,北大、华为理论证明低精度下Scaling Law难以实现
大模型量化通过降低精度来提高推理速度,但研究发现不同精度下大语言模型在基本数学任务上的表现显著下降。研究证明足够的精度是解决这些任务的重要前提,而量化会严重损害大模型的数学推理能力。
NeurIPS 2024 多样任务真实数据,亚马逊提出在线购物领域评测基准Shopping MMLU
在线购物是现代生活中必不可少的组成部分。2023 年,在线购物销售额已经占到中国全部销售额的 46%
马斯克:最迟2026年会实现AGI,人形机器人数量会突破100亿
马斯克在采访中提到AGI最晚将在2026年实现、特斯拉擎天柱机器人将广泛使用且价格亲民,猫女机器人即将问世。他还预测未来战争将通过无人机进行,并表达了对人形机器人的乐观态度。
实测昆仑万维对话AI「Skyo」,会读诗、知晓雷军摆拍
文章介绍了昆仑万维开发的Skyo实时语音对话助手,它基于天工大模型4.0打造,具备快速响应、实时打断、情感化反应等多样化功能。Skyo还能够根据不同场景切换声音,并能念诗和评价新闻事件。文章指出随着互联网高质量数据减少及大型模型训练困难,多模态AI应用正成为趋势。
多样任务真实数据,大模型在线购物基准Shopping MMLU开源|NeurIPS&KDD Cup 2024
基于亚马逊真实购物数据,港科大与圣母大学联合构建了大规模评测基准Shopping MMLU,评估大语言模型在线购物领域的应用潜力。该基准覆盖多项任务及能力,强调多任务学习、少样本学习和特定领域知识理解的重要性,并且已被公开用于研究和应用。