资讯
news
清华UCSD提出全新微调方法,8B小模型媲美GPT-4o!科学问题正确率提高28%
UCSD和清华的研究团队提出了一种方法,通过外部科学工具提高AI在解决复杂问题时的决策准确率。该研究展示了训练模型在自定义数据集上显著优于基准模型,并且在不同难度问题上的工具使用表现最佳。
Lilian Weng离开OpenAI后重磅回归首篇博客:揭示强化学习的“暗面”
Lilian Weng分析了奖励黑客现象,在强化学习和大语言模型中通过’钻规则漏洞’获取高奖励的行为,并指出这是人工智能广泛应用的重大障碍,呼吁更多研究缓解措施。
图结构转文本序列,大模型直接读懂!图推理性能大涨
大语言模型通过将图转换为适合Transformer架构的线性token序列,实现对复杂图结构的理解。该方法保留了局部依赖性和全局对齐性的关键属性,并展示了其在节点计数、最大度计算和图案形状分类等任务中的优势。
如何杀死癌细胞?斯坦福医学院:骗它开启自毁
斯坦福医学院的研究人员开发了一种新型分子,将两种蛋白质连接起来以激活癌细胞的自杀机制。该策略有望避免传统治疗方法对健康细胞的副作用,并针对弥漫大B细胞淋巴瘤进行测试。
微软:两个AI相互纠错,数学再涨5分
加州大学和微软研究院提出的新方法Flow-DPO利用两个大模型合作学习,解决数学问题时避免错误,提高推理质量和可读性。研究表明,这种方法显著提升了LLM的数学推理能力。
ChatGPT拒绝谈论这个人,没人知道为什么
ChatGPT因提及David Mayer而被限制回答,OpenAI官方否认该问题为模型层面的限制。目前已有6个名字被限制,涉及法律、科学等领域。OpenAI正计划明年达到10亿用户目标,并推出更多产品支持这一增长。
NeurIPS 2024|杜克大学&谷歌提出SLED解码框架,无需外部数据与额外训练,有效缓解大语言模型幻觉,提高事实准确性
研究团队提出自驱动 Logits 进化解码(SLED)方法,提升大语言模型事实准确性,无需外部知识库和额外微调。