跳至内容
每时AI

每时AI

  • 资讯
  • 国际
  • 分享
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 关于我们

大型语言模型

速递|Anthropic完成E轮融资,筹集了35亿美元,估值615亿美元

2025年3月4日16时 作者 Z Potentials

Anthropic完成一笔以615亿美元估值筹集35亿美元的交易,巩固其为全球最大初创公司之一的地位。

分类 国际、 资讯 标签 Anthropic、 Krishna Rao、 Ravi Mhatre、 人工智能、 大型语言模型、 聊天机器人 发表评论

一文图解大模型量化:量化的目的、内涵及若干实现策略

2025年3月4日14时 作者 老刘说NLP

个模型在GPU上运行),GGUF(可能将层卸载到CPU上)又是啥?本质是啥?这些都是困扰已久的问题。

分类 大模型 标签 大型语言模型、 权重量化、 激活值量化、 训练后量化、 量化、 量化感知训练 发表评论

IBM 悄无声息的发布了 granite-3.2-8b 开源模型

2025年3月4日8时 作者 NLP工程化

Granite-3.2-8B-Instruct-Preview 是一款早期发布的 8B 长上下文模型,专为增强推理能力而进行微调,基于 Granite-3.1-8B-Instruct 构建,并使用开放许可开源数据集和合成数据训练。

分类 开源 标签 8B、 Granite-3.2、 IBM、 Instruct、 大型语言模型、 预览版 发表评论

大神Karpathy更新AI科普视频,小白友好!

2025年3月3日14时 作者 Datawhale

Andrej Karpathy 在 YouTube 上发布了一段长达 2 小时的学习视频,详细介绍了如何使用大型语言模型(LLM),涵盖模型生态系统、交互示例和多种应用场景。

分类 分享 标签 Andrej Karpathy、 Claude Artifacts、 OCR技术、 Python解释器、 Video Input、 大型语言模型 发表评论

Search-R1:高效、可扩展的强化学习训练框架

2025年3月2日8时 作者 NLP工程化

高效、可扩展的强化学习训练框架Search-R1,支持3B规模的基础LLM,通过规则化奖励机制让LLM自主学会推理和搜索,提供完整的训练流程和工具支持。

分类 开源 标签 30亿参数、 Alibaba Cloud、 Search-R1、 大型语言模型、 强化学习、 规则化奖励机制 发表评论

Karpathy更新AI科普视频,网友:原本周末打算结个婚,改看视频了

2025年2月28日16时 作者 机器之心

Andrej Karpathy发布了一个长达2个多小时的学习视频,介绍了如何使用大型语言模型(LLM),涵盖从基础交互到高级数据分析等多方面内容。

分类 学术、 资讯 标签 AI研究科学家、 ChatGPT、 Karpathy、 大型语言模型、 学习区、 提高效率 发表评论

免费获取微软《AI + CX 转型实战指南》!营销、销售、服务难题迎刃而解~

2025年2月26日23时 作者 AIGC开放社区

专注AIGC领域的专业社区,聚焦大语言模型(LLM)及客户体验。通过嵌入AI功能提升运营效率和客户满意度,帮助企业实现营销、销售和服务转型。

分类 资讯 标签 AI客户体验、 动态内容创作、 大型语言模型、 数据分析能力、 生成式 AI、 自动化工作流 发表评论

学术调研自动化工具SurveyX

2025年2月26日12时 作者 GitHubStore

SurveyX 是一个利用大型语言模型生成高质量学术论文和调查的自动化系统。用户只需提供主题信息,即可获得定制化的学术材料。

分类 开源 标签 1-2、 SurveyX、 人工智能、 医疗保健伦理影响、 大型语言模型、 学术调查自动化系统 发表评论

大模型轻量化系列解读 (八):降低 LLM 中因 Activation Spikes 导致的量化误差

2025年2月24日23时 作者 极市干货

型语言模型在后训练量化时面临的激活量化挑战,发现GLU激活中的“激活尖峰”会导致显著的量化误差。为此

分类 学术 标签 Qwen、 动态量化的方案、 大型语言模型、 实验结果、 激活峰值、 静态量化 发表评论

深度|领英创始人:DeepSeek后, 中国已经参与AI游戏,人类需要以人性化且富有同情心的方式应对新技术

2025年2月24日12时 作者 Z Potentials

了效率,所以问题不在于它是否会有回报,问题是我们要进行哪些投资以及在什么时间范围内投资
我认为会有多

分类 国际、 资讯 标签 Reid Hoffman、 Super Agency、 人工智能投资、 大型语言模型、 情境角色、 科技人物 发表评论
较早文章
较新文章
← 上一页 页面1 … 页面6 页面7 页面8 … 页面12 下一页 →

2025年 AGI AI AI技术 Anthropic ChatGPT Claude DeepSeek DeepSeek-R1 DeepSeek R1 GitHub GPT-4o LLM Meta OpenAI Python Sam Altman 人工智能 人形机器人 具身智能 大型语言模型 大模型 大语言模型 字节跳动 工业机器人 开源 强化学习 微软 扩散模型 技术创新 智能体 木易 机器学习 深度学习 清华大学 生成式AI 用户体验 百度 腾讯 自然语言处理 英伟达 谷歌 阿里云 阿里巴巴 马斯克

分类

  • 分享
  • 国际
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 资讯
  • Flux Kontext Dev发布,免费开源一句话P图的时代到来了!
  • Meta 再挖角4名OpenAI 华人研究员!网友:希望给的钱不要比Yann LeCun 多……
  • 1小时30万辆,小米雷军教“全球销冠”特斯拉Model Y如何卖车
  • 智能PPT生成系统
  • 2025,10000个Vibe Coding井喷

2025 年 6 月
一 二 三 四 五 六 日
 1
2345678
9101112131415
16171819202122
23242526272829
30  
« 5 月    

归档

  • 2025 年 6 月
  • 2025 年 5 月
  • 2025 年 4 月
  • 2025 年 3 月
  • 2025 年 2 月
  • 2025 年 1 月
  • 2024 年 12 月
  • 2024 年 11 月

AI新闻 | X平台 | APK反编译 | 京ICP备2024096144号 |
© 2025 每时AI • Built with GeneratePress
 下载我们的APP,AI秒送达!  立即下载
×