如果GPT-4还只是阿米巴原虫,未来的霸王龙会是什么样? 赫拉利《智人之上》 2025年2月28日16时 作者 量子位 的信息革命之中。 但这到底是一场怎样的革命?最近这几年,太多突破性的发明如洪水般滚滚而来,以至于我们
WWW 2025 即插即用、轻松涨点!用不确定性助力图结构学习,提升GNN性能 2025年2月25日16时 作者 PaperWeekly 文题目: Uncertainty-Aware Graph Structure Learning 论文
ICLR 2025 SOTA性能!OSTQuant:基于正交与缩放变换的大模型量化方法 2025年2月24日23时 作者 PaperWeekly 同的量化配置中(weight-only、weight-activation 和 weight-act
比肩LLaMA 3!人大高瓴提出语言模型新范式:首个8B扩散大语言模型LLaDA 2025年2月22日23时 作者 PaperWeekly 突破性进展,展现了诸如上下文学习、指令遵循、推理和多轮对话等能力。目前,普遍的观点认为其成功依赖于自
AAAI 2025 北大提出基于大模型的动态权重评估方法,探索语法纠错系统的评估新范式 2025年1月16日12时 作者 PaperWeekly TL;DR: 本研究提出了一种新的语法纠错系统评估指标,能够根据评估句子类型不同,动态调整子指标的权
突破瓶颈!北航ETH等首次将扩散模型完全量化至1bit,28倍存储节省+52.7倍效率提升 2025年1月11日12时 作者 量子位 BiDM团队 投稿 量子位 | 公众号 QbitAI 将扩散模型量化到1比特极限,又有新SOTA了!
NeurIPS 2024 通过条件似然差异对文生图扩散模型进行成员推理 2025年1月6日16时 作者 PaperWeekly 本文是 NeurIPS 2024 入选论文《Membership Inference on Text
Meta最新研究:无需Tokenizer的架构! 2024年12月18日14时 作者 Datawhale Datawhale分享 最新:Meta,编 辑:机器之心 BLT 在许多基准测试中超越了基于 tok
“云计算一哥”一口气发布6个大模型、3nm芯片!多模态还要搞Any-to-Any 2024年12月4日15时 作者 量子位 金磊 发自 拉斯维加斯 量子位 | 公众号 QbitAI 就在刚刚,云计算一哥 亚马逊云科技 ,在大