大模型归档 - 第104页共115页

南加大团队提出MARVEL：基于认知科学的多维抽象视觉推理基准测试

下午10时 2024/12/19 作者 PaperWeekly

研究团队提出MARVEL数据集来评估多模态大语言模型的抽象视觉推理能力，该数据集中包含了770个高质量测试样例，并覆盖了六种核心知识模式、多样化的几何和抽象形状输入以及五种不同的任务配置方式。实验结果显示大多数模型在MARVEL上的表现接近随机水平，揭示出模型的视觉感知能力是提升其抽象视觉推理的关键瓶颈。

GPT-4o掀起全模态热潮！一文梳理全模态大模型最新研究进展

下午10时 2024/12/19 作者 PaperWeekly

随着 Gemini 和 GPT-4o 等系列的发布，本文尝试总结一些最近全模态相关的工作。采用联合文

揭秘监督微调（SFT）：语言模型性能跃升的秘密武器！

下午2时 2024/12/19 作者 AI技术研习社

大型语言模型（LLMs）的训练通常分为多个阶段，包括预训练和后续的微调阶段。虽然预训练成本高昂（通常

GitHub Copilot扛不住Cursor的竞争，终于推出了免费版本

下午2时 2024/12/19 作者 AI大模型实验室

GitHub Copilot 推出了新的免费计划，用户无需试用或订阅即可使用。此计划为每位用户提供每月高达2000次代码补全机会、50次聊天请求权限，并可访问多种高级模型。除此之外，GitHub 还宣布开发者数量突破1.5亿大关。

再谈大模型长文本分块，以及分块在RAG中的作用？

下午2时 2024/12/19 作者 AI探索时代

文本分块技术用于解决长文本处理中的上下文窗口限制问题。在大模型中采用类似阅读厚书的方法进行分块，使用chunk_overlap参数确保相关性。但在向量数据库中检索时，如何保证语义相关性的高效检索成为新挑战。

就在刚刚，GitHub Copilot免费了！

下午2时 2024/12/19 作者 AI信息Gap

木易分享了GitHub Copilot免费升级的消息，包括每月2000次代码建议、50条Copilot聊天消息等内容，并介绍了如何使用GitHub Copilot，同时提及了多个可供选择的AI模型和付费选项。

最顶级的AI视频模型，这次真的来了

上午10时 2024/12/19 作者路过银河AI

谷歌发布视频生成模型Veo 2，分辨率最高达4K、时长为2分钟。相比OpenAI的Sora模型，Veo 2在细节和逼真度方面表现更出色，但当前分辨率上限为720p，长度为8秒。

NeurIPS 2024 如何缓解长文本情境下的中间信息丢失问题？

下午4时 2024/12/18 作者 PaperWeekly

最近提出的方法通过在短时间内微调插入位置编码（PE）来有效地扩展预训练 LLM 的上下文窗口。然而，现有的方法仍存在两个显著的局限性：需要对目标长度进行微调，并且难以有效利用来自上下文中间部分的信息。为了解决这些问题，本文提出了 CREAM 方法，通过操纵位置索引来生成较短序列，在保持高效的同时增强模型在处理“中间”内容时的有效性。

Databricks又融了100亿美元，融资超过OpenAI，太值钱了

下午2时 2024/12/18 作者 AI大模型实验室

Databricks Inc. 成功完成100亿美元J轮融资，估值高达620亿美元，成为历史上最大规模的风险投资之一。作为数据分析和人工智能领域的领先企业，Databricks通过其 ‘数据湖屋’ 概念，利用融合数据湖与数据仓库的优势来存储和分析海量数据，并已突破30亿美元ARR的里程碑。

什么是相似性搜索？大模型的底座技术

下午2时 2024/12/18 作者 AI探索时代

相似性搜索是一种通过向量化处理非结构化数据（如文本、图像等）来理解其语义含义，并实现高效搜索的技术。它允许计算机根据语义进行查询，而非仅依赖于字符匹配。

一	二	三	四	五	六	日
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30