跳至内容
每时AI

每时AI

  • 资讯
  • 国际
  • 分享
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 关于我们

未提及

mcp-hfspace:轻松连接HuggingFace Spaces的MCP服务器

2025年3月27日8时 作者 NLP工程化

一键连接HuggingFace Spaces的MCP服务器,提升AI工具使用体验,涵盖多种功能。

分类 开源 标签 HuggingFace Spaces、 MCP-hfspace、 一键连接、 提升用户体验、 未提及、 简化AI工具使用 发表评论

一款针对金融领域复杂推理的模型:Fin-R1 7B

2025年3月26日8时 作者 NLP工程化

专业领域模型Fin-R1在金融领域复杂推理任务上超过DeepSeek-R1,支持金融分析、代码生成、风险评估和合规审查等功能。

分类 开源 标签 7B、 SUFE-AIFLM-Lab、 专业领域模型Fin-R1,7B、 优于其他同类模型、 未提及、 特定微调训练 发表评论

DeepSeek企业落地应用讲义精华版(258页)

2025年3月9日14时 作者 AI技术研习社

近期DeepSeek因其Mixture of Experts架构在国内外引起关注,本次培训将全面解析其核心功能及应用场景。

分类 大模型 标签 AI圈、 DeepSeek、 Mixture of Experts、 未提及、 热潮 发表评论

一个使用 SGLang + SkyPilot 实现高吞吐量 DeepSeek-R1 服务的教程

2025年3月4日8时 作者 NLP工程化

使用 SGLang + SkyPilot 实现高吞吐量 DeepSeek-R1 服务的教程介绍分享。

分类 开源 标签 DeepSeek-R1、 SGLang、 SkyPilot 官方、 服务实现、 未提及、 高吞吐量 发表评论

HeadInfer:通过逐头卸载实现内存高效的大语言模型推理

2025年2月26日8时 作者 NLP工程化

HeadInfer 是一个内存高效的推理框架,专为大型语言模型设计,通过逐头卸载策略减少 GPU 内存消耗。

分类 开源 标签 8B 模型、 内存优化的推理框架(HeadInfer)、 显著减少 GPU 内存消耗、 未提及、 百万级别 token 推理 发表评论

智能体概念

2025年2月23日14时 作者 PaperAgent

文章介绍了智能体的概念及其特性,并讨论了多模态和多智能体Agent的应用。强调了GPT系列语言模型在提高Agent与用户交互能力方面的作用。

分类 分享 标签 agent、 人机交互、 复杂任务、 大型预训练语言模型、 未提及、 未知 发表评论

Windsurf(可平替 Cursor) 的使用体验和技巧

2025年2月18日19时 作者 GiantPandaCV

Windsurf 是由 Codeium 开发的 VSCode 插件,支持多模型推理,并且最近引入了意图识别和 Turbo Mode 2.0 功能。相比 Cursor,WindSurf 提供更快的自动补全功能、自定义图标及工具链支持等新特性,价格更优惠。

分类 学术 标签 10、 Cursor、 Windsurf、 未提及、 风帆 发表评论

从一个简单的神经网络模型开始

2025年2月6日14时 作者 AI探索时代

文章介绍了从简单神经网络开始学习的必要性,强调理解基本原理对于掌握复杂模型的重要性,并通过对比生物神经元和人工神经元的概念来解释其工作原理。

分类 大模型 标签 复杂神经网络、 未提及、 权重调整、 生物学神经元模型、 神经网络模型基础原理、 简单神经元模型 发表评论

在浏览器里运行DeepSeek-R1

2025年1月23日8时 作者 NLP工程化

在浏览器中运行DeepSeek-R1项目,使用Transformers.js和ONNX Runtime Web技术,演示1.5B参数量的DeepSeek-R1-Distill-Qwen模型。

分类 开源 标签 150 亿参数、 DeepSeek-R1-webgpu、 ONNX Runtime Web、 Qwen-Distill-Qwen-1.5B、 Transformers.js、 未提及 发表评论

《面向生产的大语言模型构建指南》配套代码

2025年1月7日8时 作者 NLP工程化

《面向生产的大语言模型构建指南》配套代码发布,提供Jupyter笔记本支持LLM应用开发。

分类 开源 标签 Jupyter、 Python、 实践应用、 未提及、 深入理解 发表评论
较早文章
较新文章
← 上一页 页面1 页面2 页面3 下一页 →

AGI AI AI技术 Anthropic ChatGPT Claude DeepSeek DeepSeek-R1 DeepSeek R1 GitHub Google GPT-4o LLM Meta OpenAI Python Sam Altman 人工智能 人形机器人 具身智能 大型语言模型 大模型 大语言模型 字节跳动 工业机器人 开源 强化学习 微软 扩散模型 技术创新 智能体 木易 机器学习 深度学习 清华大学 生成式AI 用户体验 百度 腾讯 自然语言处理 英伟达 谷歌 阿里云 阿里巴巴 马斯克

分类

  • 分享
  • 国际
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 资讯
  • 提示词生成原型别太香!教程一步不落教给你
  • 具身智能领域代表大模型及医疗多模态数据合成思路
  • 开源AI神器!一句话精准剪辑视频片段,UP主效率提升500%
  • 人工智能初创公司Cognition AI宣布收购一家AI编程初创公司 每日并购
  • AI神器实测!妙塔AI经验萃取师&制课神器,一键经验萃取和制课太爽了!制课效率倍增!

2025 年 7 月
一 二 三 四 五 六 日
 123456
78910111213
14151617181920
21222324252627
28293031  
« 6 月    

归档

  • 2025 年 7 月
  • 2025 年 6 月
  • 2025 年 5 月
  • 2025 年 4 月
  • 2025 年 3 月
  • 2025 年 2 月
  • 2025 年 1 月
  • 2024 年 12 月
  • 2024 年 11 月

AI新闻 | X平台 | APK反编译 | 京ICP备2024096144号 |
© 2025 每时AI • Built with GeneratePress
 下载我们的APP,AI秒送达!  立即下载
×