大模型归档 - 第72页共102页

8B模型超越GPT-4o！通义实验室提出多轮对齐SDPO，让LLM更擅长多轮交互

下午11时 2025/01/26 作者 PaperWeekly

LLM 如何在多轮任务中对齐人类偏好？通义提出多轮对齐 SDPO 效果上大幅度超过标准 DPO，让

下午2时 2025/01/26 作者 AI信息Gap

大家好，我是木易，一个持续关注AI领域的互联网技术产品经理，国内Top2本科，美国Top10 CS研

下午2时 2025/01/26 作者 AI信息Gap

木易在公众号分享了关于国产模型DeepSeek-R1和老牌强手o1之间的比较，并引入了更高算力的o1-pro。近期，Eric Zelikman对Grok 3进行了测试，结果表明Grok 3在碰撞效果上表现最优，引发热议。

下午11时 2025/01/25 作者 PaperWeekly

本文介绍了一篇关于多模态大模型的研究论文《Reconstructive Visual Instruction Tuning》，提出通过重建输入图像作为监督信号来提升视觉部分的学习效果，显著提高模型的细粒度理解能力，并且代码已开源。

下午11时 2025/01/25 作者 PaperWeekly

©PaperWeekly 原创 · 作者 |
李秋科
单位 |
华南理工大学
研究方向 |
自然语言

下午2时 2025/01/25 作者 AI技术研习社

最近，我尝试对 Qwen2-VL-2B 进行微调。这是一款强大的多模态大语言模型，既能处理文本，又能

下午2时 2025/01/25 作者 AI探索时代

文章讲述了神经网络模型的重要性以及设计不同类型模型来解决不同问题的必要性。文章还提到了训练数据的质量和使用TensorFlow或PyTorch框架的技术实现，强调了实践对于理解神经网络运作机制的重要性。

下午2时 2025/01/25 作者 AI信息Gap

木易创建了‘AI信息Gap’公众号，专注于分享AI知识。2025年1月，小红书因用户激增和TikTok禁令引发流量爆发，并被网友戏称为‘洋悟运动’。DeepSeek发布新模型后引起广泛关注并决定开源。文章认为这体现了中国科技的崛起与开放精神。

下午12时 2025/01/25 作者路过银河AI

春节前推出的AI绘画模型红潮系列的新版Flux，减少了美颜级别以提升真人画面的真实感。新版在阳光街道和闺房场景中展示了真实自然的效果。

下午11时 2025/01/24 作者 PaperWeekly

学习对齐答案和未对齐答案之间的残差，要比直接学习问题到答案之间的映射更容易。
背景
当下大语言模型（