Hugging Face
Hugging Face 发布并开源大模型训练书籍《Ultra-Scale Playbook》
Hugging Face发布了《Ultra-Scale Playbook》一书,介绍大模型训练中的5D并行性、ZeRO等技术,并分享了相关实验和工具的使用经验。
RTX 4090单卡跑满血版DeepSeek-R1?清华&趋境科技联合推出KTransformers方案!
清华大学博士生木易介绍如何使用KTransformers库在RTX 4090 GPU上运行DeepSeek-R1/V3模型,包括环境搭建、模型加载及推理参数设置等步骤。
刚刚开源的新型TTS模型:Zonos!最低5s即可克隆高质量语音!
近期发现一款名为Zonos的新型高保真TTS模型,它能在快速生成特定情绪语音及精准模拟特定人声音效方面表现出色。支持多种语言,并提供包括情感调节、语音定制等功能。
AI记忆机制解析:从SOAR架构到ChatGPT记忆模式
文章探讨了人工智能中的记忆议题,包括SOAR架构、长短期记忆类型、生成式智能体的记忆应用以及AI对人类记忆的影响等,并指出当前在技术实现上仍存在局限性。
OpenAI Deep Research“被开源”:24小时成功复现,揭秘背后技术细节
用代码表示Agent行动显著提升OpenAI Deep Research系统性能,Hugging Face团队复现时采用代码Agent框架,使验证集准确率从46%提升至55.15%,未来可扩展更多文件格式和处理建议。