跳至内容
每时AI

每时AI

  • 资讯
  • 国际
  • 分享
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 关于我们

未提及

一款针对金融领域复杂推理的模型:Fin-R1 7B

2025年3月26日8时 作者 NLP工程化

专业领域模型Fin-R1在金融领域复杂推理任务上超过DeepSeek-R1,支持金融分析、代码生成、风险评估和合规审查等功能。

分类 开源 标签 7B、 SUFE-AIFLM-Lab、 专业领域模型Fin-R1,7B、 优于其他同类模型、 未提及、 特定微调训练 发表评论

DeepSeek企业落地应用讲义精华版(258页)

2025年3月9日14时 作者 AI技术研习社

近期DeepSeek因其Mixture of Experts架构在国内外引起关注,本次培训将全面解析其核心功能及应用场景。

分类 大模型 标签 AI圈、 DeepSeek、 Mixture of Experts、 未提及、 热潮 发表评论

一个使用 SGLang + SkyPilot 实现高吞吐量 DeepSeek-R1 服务的教程

2025年3月4日8时 作者 NLP工程化

使用 SGLang + SkyPilot 实现高吞吐量 DeepSeek-R1 服务的教程介绍分享。

分类 开源 标签 DeepSeek-R1、 SGLang、 SkyPilot 官方、 服务实现、 未提及、 高吞吐量 发表评论

HeadInfer:通过逐头卸载实现内存高效的大语言模型推理

2025年2月26日8时 作者 NLP工程化

HeadInfer 是一个内存高效的推理框架,专为大型语言模型设计,通过逐头卸载策略减少 GPU 内存消耗。

分类 开源 标签 8B 模型、 内存优化的推理框架(HeadInfer)、 显著减少 GPU 内存消耗、 未提及、 百万级别 token 推理 发表评论

智能体概念

2025年2月23日14时 作者 PaperAgent

文章介绍了智能体的概念及其特性,并讨论了多模态和多智能体Agent的应用。强调了GPT系列语言模型在提高Agent与用户交互能力方面的作用。

分类 分享 标签 agent、 人机交互、 复杂任务、 大型预训练语言模型、 未提及、 未知 发表评论

Windsurf(可平替 Cursor) 的使用体验和技巧

2025年2月18日19时 作者 GiantPandaCV

Windsurf 是由 Codeium 开发的 VSCode 插件,支持多模型推理,并且最近引入了意图识别和 Turbo Mode 2.0 功能。相比 Cursor,WindSurf 提供更快的自动补全功能、自定义图标及工具链支持等新特性,价格更优惠。

分类 学术 标签 10、 Cursor、 Windsurf、 未提及、 风帆 发表评论

从一个简单的神经网络模型开始

2025年2月6日14时 作者 AI探索时代

文章介绍了从简单神经网络开始学习的必要性,强调理解基本原理对于掌握复杂模型的重要性,并通过对比生物神经元和人工神经元的概念来解释其工作原理。

分类 大模型 标签 复杂神经网络、 未提及、 权重调整、 生物学神经元模型、 神经网络模型基础原理、 简单神经元模型 发表评论

在浏览器里运行DeepSeek-R1

2025年1月23日8时 作者 NLP工程化

在浏览器中运行DeepSeek-R1项目,使用Transformers.js和ONNX Runtime Web技术,演示1.5B参数量的DeepSeek-R1-Distill-Qwen模型。

分类 开源 标签 150 亿参数、 DeepSeek-R1-webgpu、 ONNX Runtime Web、 Qwen-Distill-Qwen-1.5B、 Transformers.js、 未提及 发表评论

《面向生产的大语言模型构建指南》配套代码

2025年1月7日8时 作者 NLP工程化

《面向生产的大语言模型构建指南》配套代码发布,提供Jupyter笔记本支持LLM应用开发。

分类 开源 标签 Jupyter、 Python、 实践应用、 未提及、 深入理解 发表评论

AI赋能技术栈全景指南

2025年1月2日23时 作者 NLP工程化

AI赋能技术栈全景指南介绍五大核心层级:基础设施层、智能层、工程层、可观测与治理层及Agent消费层,帮助开发者和企业清晰规划AI开发路径。

分类 开源 标签 AI开发技术栈、 人员姓名、 典型数字、 单位名称、 未提及、 突出观点 发表评论
较早文章
较新文章
← 上一页 页面1 页面2 页面3 下一页 →

2025年 AGI AI AI技术 Anthropic ChatGPT Claude DeepSeek DeepSeek-R1 DeepSeek R1 GitHub GPT-4o LLM Meta OpenAI Python Sam Altman 人工智能 人形机器人 具身智能 大型语言模型 大模型 大语言模型 字节跳动 工业机器人 开源 强化学习 微软 扩散模型 技术创新 智能体 木易 机器学习 深度学习 清华大学 生成式AI 用户体验 百度 腾讯 自然语言处理 英伟达 谷歌 阿里云 阿里巴巴 马斯克

分类

  • 分享
  • 国际
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 资讯
  • 领益智造举办机器人战略发布会,16家合作伙伴亮相,百台意向订单达成
  • 与技术谈实现,与客户谈价值,与高管谈钱!硅谷顶级产品专家亲述生存法则
  • Gemini CLI 的系统提示词
  • 月之暗面 Kimi 首个 Agent 开启内测,可生成易追溯的万字报告,有哪些技术亮点?
  • 一手实测有道14B「子曰3」数学模型,击败满血版DeepSeek R1

2025 年 6 月
一 二 三 四 五 六 日
 1
2345678
9101112131415
16171819202122
23242526272829
30  
« 5 月    

归档

  • 2025 年 6 月
  • 2025 年 5 月
  • 2025 年 4 月
  • 2025 年 3 月
  • 2025 年 2 月
  • 2025 年 1 月
  • 2024 年 12 月
  • 2024 年 11 月

AI新闻 | X平台 | APK反编译 | 京ICP备2024096144号 |
© 2025 每时AI • Built with GeneratePress
 下载我们的APP,AI秒送达!  立即下载
×