跳至内容
每时AI

每时AI

  • 资讯
  • 国际
  • 分享
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 关于我们

日期: 2025 年 2 月 25 日

700亿身价浙江大佬,疯狂帮马斯克“造人”!

下午12时 2025/02/25 作者 智东西

的底气,跟这个低调神秘的宁波男人有关。
‍
‍
‍
‍
01
.
抱腿战略
2019年至今,能让股价

分类 资讯 标签 人形机器人、 企业文化、 多元化布局、 技术创新、 新能源汽车、 邬建树 发表评论

刚刚,DeepSeek开源DeepEP,公开大模型训练效率暴涨秘诀!

下午12时 2025/02/25 作者 AIGC开放社区

专注AIGC领域的专业社区分享了开源的DeepEP库,用于优化混合专家模型训练和推理。DeepEP支持高效的All-to-All通信机制、高吞吐量和低延迟内核,以及原生支持FP8格式。

分类 资讯 标签 All-to-All通信、 DeepEP、 FP8分发、 混合专家模型、 革命性变化、 高吞吐量 发表评论

带你从零开始实现一个稀疏专家混合语言模型(MoE模型)

上午8时 2025/02/25 作者 NLP工程化

Hugging Face博客介绍了如何从零实现稀疏专家混合语言模型(MoE),通过解析代码详解自注意力机制、专家模块等组件。

分类 开源 标签 Hugging Face、 Top-k 门控、 专家模块、 深度学习、 自注意力机制、 自然语言处理(NLP) 发表评论

SiYuan:一款隐私优先、自托管、开源的知识管理软件

上午8时 2025/02/25 作者 NLP工程化

SiYuan:一款隐私优先、自托管的开源知识管理软件,支持块级引用和双向链接,提供Markdown WYSIWYG编辑器及强大数据库功能。

分类 开源 标签 Markdown编辑器、 SiYuan团队、 SQL查询技术、 开源软件、 百万字、 阿里巴巴 发表评论

最新完整RAG 实现流程:从基础知识到高级功能

上午8时 2025/02/25 作者 NLP工程化

增强生成(Retrieval-Augmented Generation, RAG)系统的架构蓝图。它

分类 开源 标签 RAG系统、 个性化、 多数据库支持、 智能路由、 生成与检索、 索引优化 发表评论

浙大开源的一个专门用于表格数据处理的语言模型:TableGPT2

上午8时 2025/02/25 作者 NLP工程化

浙大开源表格数据处理语言模型TableGPT2,支持不规则表格和模糊查询,提供7B、72B两个版本,已在GitHub上开源。

分类 开源 标签 7B版本、 TableGPT2、 企业级BI、 实际场景、 浙江大学、 语言模型 发表评论

Kimi首次开源了其一个16B参数的MoE模型:Moonlight-16B

上午8时 2025/02/25 作者 NLP工程化

Kimi开源Moonlight-16B模型,参数量16B,激活3B,性能优于LLAMA、Qwen和Deepseek-v2-Lite,在英文和中文能力上表现优异。

分类 开源 标签 kimi、 MoE模型、 Moonlight-16B、 Muon优化器策略、 NLP任务、 计算效率提高50% 发表评论

康奈尔“理解GPU架构”课程

上午8时 2025/02/25 作者 NLP工程化

康奈尔大学提供的’理解GPU架构’课程为初学者提供从基础到进阶的GPU学习路径,涵盖特性、内存和实例分析,并提供标准NVIDIA样例程序。

分类 开源 标签 Columbia大学计算机科学与工程系、 GPGPU开发、 GPU架构、 康奈尔、 标准NVIDIA样例程序、 高效计算 发表评论

Mastra:一个 TypeScript 的 AI 应用开发框架

上午8时 2025/02/25 作者 NLP工程化

今日GitHub Trending榜首项目Mastra是一款集成多种AI开发工具的TypeScript框架

分类 开源 标签 AI、 GitHub、 Mastra-ai、 NLP、 TypeScript、 应用框架 发表评论

DeepSeek开源周第一天,FlashMLA

上午8时 2025/02/25 作者 NLP工程化

DeepSeek开源其最新模型FlashMLA,欢迎加入Dify知识星球获取更多资源和技术支持。

分类 开源 标签 DeepSeek公司、 DeepSeek团队、 提高准确率、 文本分类技术、 机器学习算法、 自然语言处理领域 发表评论
较早文章
较新文章
← 上一页 页面1 … 页面9 页面10 页面11 页面12 下一页 →

2025年 AGI AI AI技术 Anthropic ChatGPT Claude DeepSeek DeepSeek-R1 DeepSeek R1 GitHub GPT-4o LLM Meta OpenAI Python Sam Altman 人工智能 人形机器人 具身智能 大型语言模型 大模型 大语言模型 字节跳动 开源 强化学习 微软 扩散模型 技术创新 智能体 木易 机器学习 深度学习 清华大学 生成式AI 用户体验 百度 腾讯 自然语言处理 英伟达 谷歌 阿里云 阿里巴巴 马斯克 黄仁勋

近期文章

  • 完全开源的7B模型,性能比肩主流LLM,训练成本仅16万美元,复现DeepSeek的强化学习!
  • 全球用户更爱用哪个AI模型?OpenAI和谷歌领跑,Anthropic下滑,多个国产模型表现突出
  • Ruby on Rails 之父 DHH 预言:未来“写代码”会变成不合时宜的念头!
  • 7k星星爆火!用微信聊天记录训练一个自己的数字分身回信息,还能克隆声音回复语音消息。
  • 全国人大常委会和国务院公布立法计划,AI立法有何变化?

分类

  • 分享
  • 国际
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 资讯
2025 年 2 月
一 二 三 四 五 六 日
 12
3456789
10111213141516
17181920212223
2425262728  
« 1 月   3 月 »

归档

  • 2025 年 5 月
  • 2025 年 4 月
  • 2025 年 3 月
  • 2025 年 2 月
  • 2025 年 1 月
  • 2024 年 12 月
  • 2024 年 11 月

AI新闻 | X平台 | APK反编译 | 京ICP备2024096144号 |
© 2025 每时AI • Built with GeneratePress
 下载我们的APP,AI秒送达!  立即下载
×