大模型
大语言模型
精度与通用性不可兼得,北大、华为理论证明低精度下Scaling Law难以实现
大模型量化通过降低精度来提高推理速度,但研究发现不同精度下大语言模型在基本数学任务上的表现显著下降。研究证明足够的精度是解决这些任务的重要前提,而量化会严重损害大模型的数学推理能力。
NeurIPS 2024 多样任务真实数据,亚马逊提出在线购物领域评测基准Shopping MMLU
在线购物是现代生活中必不可少的组成部分。2023 年,在线购物销售额已经占到中国全部销售额的 46%
Wiley Advanced系列将陆续上线六种期刊,包括两种聚焦人工智能领域期刊
全球出版商Wiley宣布扩展其Advanced系列期刊至生命科学和医学领域,新增六种新期刊,并计划到2026年底在细胞、分子生物学等重要学科发布更多期刊。这一举措旨在为科研工作者提供跨学科优势,助力解决全球挑战如癌症治疗、气候变化及粮食安全等问题。
NeurIPS 2024 利用概念激活向量破解大模型的安全对齐,人大&港科大揭示LLM重要安全风险漏洞
随着大语言模型能力的快速提升,其潜在的安全隐患愈发显著。尽管开发者进行了大量安全对齐工作,以避免模型被用于恶意 … 阅读更多
4090 GPU免费用!你的学术挚友来了!无惧实验痛苦面具
十一月科研实验忙?厚德云助你节省算力资源和精力。注册教育优惠领88元代金券,搭配5折券开卡;学术加速配置轻松搞定;稳定可靠的服务响应迅速,支持Windows镜像。此外还有免费AI课程、在线训练模型及比赛机会等福利。