每时AI
精度与通用性不可兼得,北大华为理论证明低精度下scaling law难以实现
本文介绍了来自北京大学和华为的研究团队对量化技术在大语言模型中的应用及其影响进行了研究。他们发现量化会显著降低大模型的基本数学能力,尤其是在处理算术任务时表现更差。研究者提出了理论模型来解释这一现象,并通过实验验证了其结果。
ChatGPT击败50名人类医生!疾病诊断准确率达90%,OpenAI总裁:人机合作还得加强
用ChatGPT辅助诊断疾病的研究结果显示,其准确率高达76%,比人类医生单独诊断高出2个百分点。但独立使用ChatGPT时,准确率进一步提升至92%。这表明AI在某些情境下表现更佳,但仍需与人类医生合作优化表现。
扩散模型版CS: GO!世界模型+强化学习:2小时训练登顶Atari 100K
DIAMOND是日内瓦大学和爱丁堡大学提出的一种新型强化学习智能体,能在由扩散模型构建的虚拟世界中高效学习各种任务。在Atari 100k基准测试中,其平均得分超越了人类玩家,尤其擅长处理复杂环境中的细节和决策。