LLMs归档 - 第2页共3页 - 每时AI

喝点VC｜a16z访谈Rasa创始人：我们没有幻觉的风险，没有提示注入和劫持等风险

下午4时 2025/02/23 作者 Z Potentials

向用户发送任何生成文本，这样我们就可以完全自信地说，我们没有幻觉的风险，没有提示注入和劫持等风险。

Deepseek R1及Deep research复现回顾及近期前沿进展速递

下午7时 2025/02/16 作者老刘说NLP

2025年02月16日，北京晴天。社区第39讲《DeepseekR1及Deepresearch复现》顺利结束，老刘报告了4小时深度讨论内容。介绍了大模型推理和复现进展，包括DeepSeek-MoE-ResourceMap、OpenR1-Math-Raw等资源库，并展示了OpenThinker-32B在MATH500测试中的表现。研究发现，长链推理的结构比内容更重要。老刘呼吁社区成员参与讨论。

比知识蒸馏好用，田渊栋等提出连续概念混合，再度革新Transformer预训练框架

下午12时 2025/02/16 作者机器之心

CoCoMix 是一种预训练框架，结合连续概念与稀疏自编码器学习的语义概念，通过交叉熵损失预测选定的概念，并将其混合到模型隐藏状态中，显著提升大型语言模型性能。

大神Andrej的最新AI课：大语言模型LLM深入详解

上午8时 2025/02/16 作者 NLP工程化

文章介绍了LLMs从预训练到微调的全过程，并涉及数据收集、分词、神经网络工作原理、推理过程、模型优化及性能提升方法。

网传DeepSeek R1更容易被越狱？这有个入选顶会的防御框架SelfDefend

下午4时 2025/02/11 作者机器之心

香港科技大学等团队提出SelfDefend框架，让大语言模型首次具备自我保护能力，有效抵御越狱攻击。该框架通过创建并行的影子LLM来检测潜在有害查询，并在不影响正常响应的情况下提升安全性。

大模型SFT负责记忆、RL负责泛化：兼看多模态GraphRAG之Video方案

下午2时 2025/02/05 作者老刘说NLP

今天是2025年02月05日，星期三，北京，天气晴。
今天是大年初八，正式开工，大家开工大吉，今年多

喝点VC｜a16z：千亿市场的AI变革就是现在，会计软件仍处于“里根时代”

下午12时 2025/01/02 作者 Z Potentials

图片来源：
a16Z
Z Highlights
我们关注到目前有两个重要的市场趋势：一是越来越少的人

澳国立推出A³-CodGen框架：多维知识融合助力代码仓库级别代码生成

上午8时 2024/12/30 作者 PaperWeekly

论文提出A³-CodGen框架，通过整合本地、全局和第三方库信息提升LLMs生成高质量代码的能力。该框架包括知识构建、三类知识检索及代码生成三个阶段。实验表明，全面知识增强显著提升了LLMs的复用能力和正确性。