大模型归档 - 第66页共131页

ICLR 2025 小型AI也能懂人类？中山大学全新方法ADPA让小模型对齐实现大突破！

2025年3月19日16时作者 PaperWeekly

型偏好对齐
背景
在
AI
的世界里，大型语言模型（
LLMs
）凭借强大的参数量和计算能力，已经能

2025年3月19日16时作者 PaperWeekly

通事故等，从而减少人工干预、提高效率。在大模型时代，随着大规模预训练模型，尤其是视觉语言模型（VLM

2025年3月19日14时作者老刘说NLP

大多未探索的挑战。与文本推理不同，
多模态推理要求模型迭代地从图像中提取、构建和验证信息
。
关于多

2025年3月19日14时作者 AI探索时代

文章指出目前人工智能的主要问题是数据问题，尽管大模型技术进步显著，但其在具体应用场景中的表现不尽如人意，主要是因为缺乏行业数据支持。

2025年3月19日14时作者 AI信息Gap

谷歌发布的Gemini 2.0 Flash模型不仅支持文本聊天，还具备原生生图功能。其去水印能力惊艳，仅需几秒钟即可去除图片中的水印标识，并能自动填补因去除水印而留下的空白，但有时会引入自己的水印或影响其他文字部分的清晰度。

2025年3月19日11时作者路过银河AI

今天推荐的AI绘画模型Fluxmania更新至5.0，展示了乡村风肖像、沙漠月夜、月下剑士等多幅作品。其中包括人物穿着复古服装站在户外、沙漠中的孤身影子、夜晚佩戴黑色贝雷帽和高领毛衣的人、神秘优雅黑衣女子、太空探险者在沙漠中穿行场景、烟雾缭绕的短发男子，以及沉思者的光影画面。

2025年3月18日16时作者路过银河AI

文章介绍了多种传统和时尚服饰的图像，包括日本和服、海军蓝长袖上衣与白色短裤搭配黑色高跟鞋和丝袜的形象、全身黑装搭配十字架项链的人物、优雅复古风的女性、舞台上的多彩风采以及自然环境中的少女。

2025年3月18日16时作者 PaperWeekly

Sparrow 通过利用长文本 QA 数据合成“伪视频指令数据”，在仅使用30K混合数据的情况下超越了100K视频数据，且在数据规模扩展上性能优势更为明显。该研究重新审视了合成数据的特性，并提出了一种新的数据增强方法——Sparrow，显著提升了模型在长视频理解上的表现。

2025年3月18日16时作者 PaperWeekly

本文介绍了一种新的多模态大规模强化学习框架MM-Eureka，该框架能够稳定地训练包括InternVL2.5-Instruct-8B和InternVL2.5-Pretrained-38B在内的多种大型模型，并使用较少的数据实现了性能的提升。

2025年3月18日16时作者 PaperWeekly

想正冲击着整个 AI 界：这些大语言模型是否已悄然孕育出超越人类的“超级智能”？
在认知科学的定义里