量子位，作者每时AI - 第102页共106页

LLM也会和人类一样焦虑！还会产生更多偏见，图宾根大学最新研究

下午8时 2024/11/28 作者量子位

研究首次将精神病学工具应用于大模型评估，发现超过半数模型会受到焦虑影响，并且更容易产生带有偏见的回答。

下午8时 2024/11/28 作者量子位

月之暗面Kimi联合清华大学等机构开源大模型推理架构Mooncake，采用分阶段方式逐步实现高性能KVCache多级缓存的开源。该架构提升了Kimi用户体验，降低了成本，并为处理长文本和高并发需求提供了解决方案。

下午6时 2024/11/28 作者量子位

通义千问团队发布推理模型QwQ，参数量32B，在GPQA等数据集上击败o1-mini，并开源。但其回答较长且冗余，后续需改进简洁度。

下午1时 2024/11/28 作者量子位

国产o1新选手登场，上海AI实验室版o1——书生InternThinker能快速解决数学、代码编程等任务，并能在推理过程中进行自我反思和纠正。其长思维能力提升显著，已在数学、代码及逻辑谜题等多种场景中展现优势。

上午10时 2024/11/28 作者量子位

NeurIPS颁发了两个时间检验奖，分别是GAN（引用超过85,000次）和Seq2Seq（引用超过27,000次）。GAN在生成建模中具有基础性作用；Seq2Seq启发了编码器-解码器架构的发展。

下午4时 2024/11/27 作者量子位

金磊发自凹非寺
量子位 | 公众号 QbitAI
家人们，
o1大模型
，最近着实是有点火啊。

下午1时 2024/11/27 作者量子位

清华大学魏朝晖团队发现噪声可导致量子优势突然消失的现象，并首次将其发表于Science Advances。研究揭示了量子信息处理中噪声对量子计算性能的显著影响，为量子纠错机制的应用提供了指导。

下午1时 2024/11/27 作者量子位

研究人员提出Cautious Optimizers优化器，在不损害训练效果的情况下提升了大模型的训练效率47%，该优化器已在GitHub上开源。它通过引入掩蔽机制来避免参数更新方向与当前梯度方向相悖，从而加速了训练过程并保持了收敛特性。

下午1时 2024/11/27 作者量子位

北大李戈课题组投稿
量子位 | 公众号 QbitAI
代码模型SFT对齐后，缺少进一步偏好学习的问

下午1时 2024/11/27 作者量子位

金磊发自凹非寺
量子位 | 公众号 QbitAI
家人们，
国产o1大模型
，最近着实是有点火啊