跳至内容
每时AI

每时AI

  • 资讯
  • 国际
  • 分享
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 关于我们

Hugging Face

带你从零开始实现一个稀疏专家混合语言模型(MoE模型)

2025年2月25日8时 作者 NLP工程化

Hugging Face博客介绍了如何从零实现稀疏专家混合语言模型(MoE),通过解析代码详解自注意力机制、专家模块等组件。

分类 开源 标签 Hugging Face、 Top-k 门控、 专家模块、 深度学习、 自注意力机制、 自然语言处理(NLP) 发表评论

Qwen2.5-VL可以识别超过1小时的长视频了

2025年2月22日8时 作者 NLP工程化

Qwen2.5-VL新增长视频理解能力,能识别超过1小时的视频,并提供视觉本地化和结构化输出功能。

分类 开源 标签 1小时、 Hugging Face、 Qwen2.5-VL、 事件检测、 结构化输出、 长视频理解 发表评论

Hugging Face 发布并开源大模型训练书籍《Ultra-Scale Playbook》

2025年2月21日8时 作者 NLP工程化

Hugging Face发布了《Ultra-Scale Playbook》一书,介绍大模型训练中的5D并行性、ZeRO等技术,并分享了相关实验和工具的使用经验。

分类 开源 标签 4000多次扩展实验、 5D并行性、 Hugging Face、 Ultra-Scale Playbook、 Zero、 快速CUDA内核 发表评论

RTX 4090单卡跑满血版DeepSeek-R1?清华&趋境科技联合推出KTransformers方案!

2025年2月17日14时 作者 AI信息Gap

清华大学博士生木易介绍如何使用KTransformers库在RTX 4090 GPU上运行DeepSeek-R1/V3模型,包括环境搭建、模型加载及推理参数设置等步骤。

分类 国际、 大模型 标签 Hugging Face、 KTransformers、 NVIDIA A100、 NVIDIA Tesla T4、 PyTorch、 木易 发表评论

X-R1:低成本训练0.5B R1-Zero模型的高效框架

2025年2月15日8时 作者 NLP工程化

低成本高效训练R1-Zero模型,仅需4张3090/4090显卡1小时成本不到7美元,支持更大规模模型。

分类 开源 标签 3090显卡、 5亿参数、 GitHub平台、 Hugging Face、 X-R1模型、 知识星球 发表评论

淘宝卖DeepSeek安装包一月赚数十万???我们免费教你本地部署DeepSeek-R1

2025年2月12日23时 作者 机器之心

型,DeepSeek 竟能让倒卖商如此大赚特赚,也着实让人震惊。而这也从侧面佐证了 DeepSeek

分类 学术、 资讯 标签 DeepSeek-R1、 GPU或CPU、 Hugging Face、 LM Studio、 Python、 RAG 发表评论

刚刚开源的新型TTS模型:Zonos!最低5s即可克隆高质量语音!

2025年2月12日8时 作者 开源星探

近期发现一款名为Zonos的新型高保真TTS模型,它能在快速生成特定情绪语音及精准模拟特定人声音效方面表现出色。支持多种语言,并提供包括情感调节、语音定制等功能。

分类 开源 标签 Hugging Face、 RTX 4090显卡、 Zonos模型、 多语言支持、 文本到语音、 高保真语音克隆 发表评论

如何让普通的大模型像 DeepSeek 一样思考

2025年2月11日8时 作者 NLP工程化

Mervin Praison 提出的方案包括问答生成器、评估器、推理步骤生成器和数据上传器,用于创建高质量的数据集。

分类 开源 标签 Hugging Face、 Mervin Praison、 NLP 方案、 推理步骤生成器、 评估器、 问答生成器 发表评论

AI记忆机制解析:从SOAR架构到ChatGPT记忆模式

2025年2月10日16时 作者 AI工程化

文章探讨了人工智能中的记忆议题,包括SOAR架构、长短期记忆类型、生成式智能体的记忆应用以及AI对人类记忆的影响等,并指出当前在技术实现上仍存在局限性。

分类 分享 标签 ChatGPT、 Hugging Face、 Ksenia Se、 伦理问题、 生成式智能体、 记忆方式 发表评论

OpenAI Deep Research“被开源”:24小时成功复现,揭秘背后技术细节

2025年2月8日16时 作者 智东西

用代码表示Agent行动显著提升OpenAI Deep Research系统性能,Hugging Face团队复现时采用代码Agent框架,使验证集准确率从46%提升至55.15%,未来可扩展更多文件格式和处理建议。

分类 资讯 标签 30%、 DeepSeek-R1、 Hugging Face、 代码Agent框架、 微软研究院、 提升系统性能 发表评论
较早文章
较新文章
← 上一页 页面1 … 页面5 页面6 页面7 … 页面10 下一页 →

AGI AI AI技术 Anthropic ChatGPT Claude DeepSeek DeepSeek-R1 DeepSeek R1 GitHub Google GPT-4o LLM Meta OpenAI Python Sam Altman 人工智能 人形机器人 具身智能 大型语言模型 大模型 大语言模型 字节跳动 工业机器人 开源 强化学习 微软 扩散模型 技术创新 智能体 木易 机器学习 深度学习 清华大学 生成式AI 用户体验 百度 腾讯 自然语言处理 英伟达 谷歌 阿里云 阿里巴巴 马斯克

分类

  • 分享
  • 国际
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 资讯
  • 马斯克:Grok AI最迟下周“上车”
  • 训练了P站的大模型,升级了
  • 这场顶级科学论坛看好量子计算、人工智能、室温超导、可控核聚变
  • 研究显示:AI 并没有提升编程效率,它反而让你变慢了19%
  • 让投资决策更智能!AI赋能的股票分析神器

2025 年 7 月
一 二 三 四 五 六 日
 123456
78910111213
14151617181920
21222324252627
28293031  
« 6 月    

归档

  • 2025 年 7 月
  • 2025 年 6 月
  • 2025 年 5 月
  • 2025 年 4 月
  • 2025 年 3 月
  • 2025 年 2 月
  • 2025 年 1 月
  • 2024 年 12 月
  • 2024 年 11 月

AI新闻 | X平台 | APK反编译 | 京ICP备2024096144号 |
© 2025 每时AI • Built with GeneratePress
 下载我们的APP,AI秒送达!  立即下载
×