清华大学KVCache.AI团队联合趋境科技发布的KTransformers开源项目
清华大学KVCache.AI团队联合趋境科技发布KTransformers开源项目,支持24G显存在本地运行DeepSeek-R1、V3的671B满血版,预处理和推理速度提升。
清华大学KVCache.AI团队联合趋境科技发布KTransformers开源项目,支持24G显存在本地运行DeepSeek-R1、V3的671B满血版,预处理和推理速度提升。
腾讯智能工作台 ima.copilot 推出双模版本,接入 DeepSeek-R1 后提升搜索、读写能力。支持批量导入微信生态资源,并能灵活选择信息来源。
DeepScaleR-1.5B-Preview 成功复现 Deepseek-R1 的训练方法,成本仅需4500美元。该模型在AIME2024竞赛中超越了O1-Preview,展示了小模型通过强化学习也能实现飞跃的潜力。
文章介绍了如何使用字节火山引擎版DeepSeek-R1模型,包括本地部署和API服务两种方式,并详细描述了获取API key及调用API的方法。文章还提到了火山引擎的模型广场、在线推理创建接入点等操作步骤。最后给出了一个简单的测试案例验证了模型的能力。
上周推出的DeepSeek教程涵盖了多种部署方式。今天推出Mac本地可视化部署教程,通过下载Ollama并安装模型实现本地化使用,并介绍了可视化的搭建方法来提高工作效率。
猿辅导集团旗下的小猿学练机和小猿口算接入DeepSeek推理大模型,并将与自研的猿力大模型融合。目前已有多个教育厂商加入,推动教育AI持续深化。
支付宝百宝箱接入DeepSeek模型,提供免费满血版R1智能体,支持0代码创建应用,可构建对话型和工作流类型智能体,实现联网搜索等功能,助力更多用户接触AI技术。
无问芯穹上线满血版DeepSeek-R1、V3模型,支持多平台部署。通过大模型服务平台,无需邀请即可免费使用。同时提供异构算力支持和并发服务包模式。