大型语言模型归档 - 第7页共12页

速递｜Anthropic完成E轮融资，筹集了35亿美元，估值615亿美元

2025年3月4日16时作者 Z Potentials

Anthropic完成一笔以615亿美元估值筹集35亿美元的交易，巩固其为全球最大初创公司之一的地位。

2025年3月4日14时作者老刘说NLP

个模型在GPU上运行），GGUF（可能将层卸载到CPU上）又是啥？本质是啥？这些都是困扰已久的问题。

2025年3月4日8时作者 NLP工程化

Granite-3.2-8B-Instruct-Preview 是一款早期发布的 8B 长上下文模型，专为增强推理能力而进行微调，基于 Granite-3.1-8B-Instruct 构建，并使用开放许可开源数据集和合成数据训练。

2025年3月2日8时作者 NLP工程化

高效、可扩展的强化学习训练框架Search-R1，支持3B规模的基础LLM，通过规则化奖励机制让LLM自主学会推理和搜索，提供完整的训练流程和工具支持。

2025年2月28日16时作者机器之心

Andrej Karpathy发布了一个长达2个多小时的学习视频，介绍了如何使用大型语言模型（LLM），涵盖从基础交互到高级数据分析等多方面内容。

2025年2月26日23时作者 AIGC开放社区

专注AIGC领域的专业社区，聚焦大语言模型（LLM）及客户体验。通过嵌入AI功能提升运营效率和客户满意度，帮助企业实现营销、销售和服务转型。

2025年2月26日12时作者 GitHubStore

SurveyX 是一个利用大型语言模型生成高质量学术论文和调查的自动化系统。用户只需提供主题信息，即可获得定制化的学术材料。

2025年2月24日23时作者极市干货

型语言模型在后训练量化时面临的激活量化挑战，发现GLU激活中的“激活尖峰”会导致显著的量化误差。为此

2025年2月24日12时作者 Z Potentials

了效率，所以问题不在于它是否会有回报，问题是我们要进行哪些投资以及在什么时间范围内投资
我认为会有多