跳至内容
每时AI

每时AI

  • 资讯
  • 国际
  • 分享
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 关于我们

NLP工程化

DeepSick-R1:轻松复现DeepSeek-R1的高效代码库

2025年3月27日8时 作者 NLP工程化

DeepSick-R1 提供简洁高效的代码库(3个核心文件,825行),利用vLLM加速生成并支持多GPU训练。

分类 开源 标签 ByungKwanLee、 NLP、 vLLM加速技术、 代码库、 未知、 简洁高效 发表评论

mcp-hfspace:轻松连接HuggingFace Spaces的MCP服务器

2025年3月27日8时 作者 NLP工程化

一键连接HuggingFace Spaces的MCP服务器,提升AI工具使用体验,涵盖多种功能。

分类 开源 标签 HuggingFace Spaces、 MCP-hfspace、 一键连接、 提升用户体验、 未提及、 简化AI工具使用 发表评论

Playwright MCP:为LLM提供高效、轻量级的浏览器自动化工具

2025年3月27日8时 作者 NLP工程化

Playwright MCP 提供高效、轻量级的浏览器自动化工具,无需截图或视觉模型即可操作网页,支持无头和有头模式。

分类 开源 标签 GitHub、 Playwright MCP 开发团队、 导航功能、 无头模式、 浏览器自动化工具、 结构化数据 发表评论

DeepSeek-V3-0324开源

2025年3月26日8时 作者 NLP工程化

DeepSeek-V3-0324 在数学推理和前端开发方面表现优于 Claude 3.5 和 Claude 3.7 Sonnet,这是 DeepSeek 最佳非推理模型。

分类 开源 标签 Claude 3.5、 Claude 3.7 Sonnet、 DeepSeek-V3-0324、 前端开发、 数学推理 发表评论

一款针对金融领域复杂推理的模型:Fin-R1 7B

2025年3月26日8时 作者 NLP工程化

专业领域模型Fin-R1在金融领域复杂推理任务上超过DeepSeek-R1,支持金融分析、代码生成、风险评估和合规审查等功能。

分类 开源 标签 7B、 SUFE-AIFLM-Lab、 专业领域模型Fin-R1,7B、 优于其他同类模型、 未提及、 特定微调训练 发表评论

微软KBLaM技术,解决了LLM高效整合外部知识的问题

2025年3月26日8时 作者 NLP工程化

微软推出KBLaM技术,直接嵌入外部知识到模型注意力层,无需重新训练,比RAG更高效灵活。

分类 开源 标签 GitHub、 KBLaM、 大模型、 微软、 持续学习、 注意力层 发表评论

Qwen2.5-VL-32B-Instruct开源

2025年3月26日8时 作者 NLP工程化

Qwen2.5-VL-32B-Instruct 在多模态任务中表现出色,并在 MM-MT-Bench 基准测试中相比前代模型取得显著进步。

分类 开源 标签 Gemma-3-27B-IT、 Mistral-Small-3.1-24B、 MM-MT-Bench、 Qwen、 Qwen2.5-VL-32B-Instruct、 多模态任务 发表评论

5 个用于智能体记忆的框架,100% 开源

2025年3月25日8时 作者 NLP工程化

5个开源框架用于智能体记忆:Graphiti构建时间感知的知识图谱;Letta提供透明且长期记忆状态的智能体;Mem0结合LLM和向量存储技术主动学习适应变化;Memary赋予AI类似人类的记忆能力;Cognee将知识图谱与RAG结合维护动态知识图谱。

分类 开源 标签 Cognee、 Graphiti、 Letta、 Mem0、 Memary、 大语言模型 发表评论

面向C语言用户的汇编教程

2025年3月25日8时 作者 NLP工程化

文章介绍了从C语言到汇编语言的学习过程,并详细讲解了汇编语言的核心概念及其与不同架构(x86_64、ARM64和RISC-V)的差异。

分类 开源 标签 ARM64、 C语言、 x86_64、 内存管理、 寄存器、 汇编语言 发表评论

LLM MOE的进化之路

2025年3月25日8时 作者 NLP工程化

本文介绍了三种不同版本的MOE模型:基础版MOE、大模型用的SparseMoE以及Deepseek使用的shared_expert SparseMoE。

分类 开源 标签 Bruce Yuan、 DeepSeek、 MOE models、 shared_expert、 Sparse MOE、 深度学习 发表评论
较早文章
较新文章
← 上一页 页面1 … 页面31 页面32 页面33 … 页面74 下一页 →

2025年 AGI AI AI技术 Anthropic ChatGPT Claude DeepSeek DeepSeek-R1 DeepSeek R1 GitHub GPT-4o LLM MCP Meta OpenAI Python Sam Altman 人工智能 人形机器人 具身智能 大型语言模型 大模型 大语言模型 字节跳动 开源 强化学习 微软 扩散模型 技术创新 智能体 木易 机器学习 深度学习 清华大学 生成式AI 用户体验 百度 腾讯 自然语言处理 英伟达 谷歌 阿里云 阿里巴巴 马斯克

分类

  • 分享
  • 国际
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 资讯
  • 真·遥遥领先!华为式“AI全家桶”亮相HDC2025,鸿蒙、盘古与384超节点照亮新可能
  • AI大模型驱动的开源知识库搭建系统,可以做成钉钉、飞书、企业微信等聊天机器人。
  • OpenAI或将失去孙正义200亿美元投资
  • 六个安全Agent设计模式:有效防止Prompt注入攻击
  • 扎克伯格盯上了OpenAI前首席科学家Ilya的公司!

2025 年 6 月
一 二 三 四 五 六 日
 1
2345678
9101112131415
16171819202122
23242526272829
30  
« 5 月    

归档

  • 2025 年 6 月
  • 2025 年 5 月
  • 2025 年 4 月
  • 2025 年 3 月
  • 2025 年 2 月
  • 2025 年 1 月
  • 2024 年 12 月
  • 2024 年 11 月

AI新闻 | X平台 | APK反编译 | 京ICP备2024096144号 |
© 2025 每时AI • Built with GeneratePress
 下载我们的APP,AI秒送达!  立即下载
×