GPT-3.5归档 - 每时AI

网传DeepSeek R1更容易被越狱？这有个入选顶会的防御框架SelfDefend

下午4时 2025/02/11 作者机器之心

香港科技大学等团队提出SelfDefend框架，让大语言模型首次具备自我保护能力，有效抵御越狱攻击。该框架通过创建并行的影子LLM来检测潜在有害查询，并在不影响正常响应的情况下提升安全性。

上午8时 2025/01/17 作者 AIGC开放社区

专注于AIGC领域的专业社区，关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型（LLM）的发展和应用落地。斯坦福大学与加州伯克利大学发布的《ChatGPT行为随时间变化》论文详细分析了GPT-3.5和GPT-4的性能波动及其原因，包括指令遵循度的变化、内容过滤能力的下降等问题。

下午4时 2025/01/02 作者量子位

潞晨科技创始人尤洋博士介绍了公司开发的视频生成模型VideoOcean，并提出视频大模型应实现精细化文本控制、任意机位/角度以及角色一致性等目标，预计3年后将迎来GPT-3.5级别的突破。

上午8时 2024/12/30 作者 PaperWeekly

论文提出A³-CodGen框架，通过整合本地、全局和第三方库信息提升LLMs生成高质量代码的能力。该框架包括知识构建、三类知识检索及代码生成三个阶段。实验表明，全面知识增强显著提升了LLMs的复用能力和正确性。