未提及归档 - 第2页共3页

mcp-hfspace：轻松连接HuggingFace Spaces的MCP服务器

2025年3月27日8时作者 NLP工程化

一键连接HuggingFace Spaces的MCP服务器，提升AI工具使用体验，涵盖多种功能。

2025年3月26日8时作者 NLP工程化

专业领域模型Fin-R1在金融领域复杂推理任务上超过DeepSeek-R1，支持金融分析、代码生成、风险评估和合规审查等功能。

2025年3月9日14时作者 AI技术研习社

近期DeepSeek因其Mixture of Experts架构在国内外引起关注，本次培训将全面解析其核心功能及应用场景。

2025年3月4日8时作者 NLP工程化

使用 SGLang + SkyPilot 实现高吞吐量 DeepSeek-R1 服务的教程介绍分享。

2025年2月26日8时作者 NLP工程化

HeadInfer 是一个内存高效的推理框架，专为大型语言模型设计，通过逐头卸载策略减少 GPU 内存消耗。

2025年2月18日19时作者 GiantPandaCV

Windsurf 是由 Codeium 开发的 VSCode 插件，支持多模型推理，并且最近引入了意图识别和 Turbo Mode 2.0 功能。相比 Cursor，WindSurf 提供更快的自动补全功能、自定义图标及工具链支持等新特性，价格更优惠。

2025年2月6日14时作者 AI探索时代

文章介绍了从简单神经网络开始学习的必要性，强调理解基本原理对于掌握复杂模型的重要性，并通过对比生物神经元和人工神经元的概念来解释其工作原理。

2025年1月23日8时作者 NLP工程化

在浏览器中运行DeepSeek-R1项目，使用Transformers.js和ONNX Runtime Web技术，演示1.5B参数量的DeepSeek-R1-Distill-Qwen模型。

2025年1月7日8时作者 NLP工程化

《面向生产的大语言模型构建指南》配套代码发布，提供Jupyter笔记本支持LLM应用开发。