跳至内容
每时AI

每时AI

  • 资讯
  • 国际
  • 分享
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 关于我们

NLP工程化

AGI-Alpha-Agent-v0:多Agent的AGI项目,致力于从识别到执行的端到端流程

2025年5月11日8时 作者 NLP工程化

AGI-Alpha-Agent-v0是跨行业多Agent项目,采用MuZero技术提升决策能力,支持云原生和离线运行,涵盖金融、生物、制造等众多领域。

分类 开源 标签 AGI-Alpha-Agent-v0、 MontrealAI、 MuZero风格的潜伏规划技术、 云原生和离线运行支持、 提升决策能力、 跨行业应用 发表评论

VITA-Audio:一款高效的语音语言模型,能够快速生成音频和文本内容

2025年5月10日8时 作者 NLP工程化

VITA-Audio是一款高效的语音语言模型,显著降低音频生成延迟至53毫秒,并提升推理速度3-4倍。训练数据包含20万小时音频,已开源。

分类 开源 标签 20万小时、 53毫秒、 VITA-Audio、 开源数据训练技术、 语音语言模型、 阿里巴巴 发表评论

Clippy:用AI赋予经典办公助手新生命,让你在本地轻松运行大型语言模型

2025年5月10日8时 作者 NLP工程化

Clippy是一款基于AI的办公助手,本地运行、支持多种模型格式且易于使用,保护用户隐私。

分类 开源 标签 AI技术、 Clippy、 GGUF格式、 GitHub、 知识星球、 隐私保护 发表评论

Toolkami:仅用七个工具实现的极简AI Agent框架,轻松打造高效智能自动化流程

2025年5月10日8时 作者 NLP工程化

Toolkami 极简AI Agent框架介绍,仅需七个工具构建强大AI Agent,支持热重载和Turbo模式。

分类 开源 标签 AI Agent框架、 Toolkami团队、 Turbo模式、 七个工具、 无特定人员、 热重载 发表评论

从零到一:学习代理模式

2025年5月9日8时 作者 NLP工程化

来自 Google DeepMind 的 Philipp Schmid 分享的《从零到一:学习代理模式》文章介绍了 3 种工作流模式和 4 种代理模式,适合 AI 代理系统开发者参考。

分类 开源 标签 Google DeepMind、 Philipp Schmid、 代理模式、 代码示例、 工作流模式、 开发 发表评论

字节的基于 MCP 的 AI Agent 应用开发实践

2025年5月9日8时 作者 NLP工程化

本文以开发 Agent TARS 应用为例,详细介绍MCP在开发范式和工具生态扩展上的作用。

分类 开源 标签 Agent TARS、 MCP、 工具生态、 开发范式、 未提及、 未知 发表评论

在 96 块 H100 GPU 上通过参数分解与大规模专家并行技术部署 DeepSeek

2025年5月9日8时 作者 NLP工程化

通过参数分解与大规模专家并行技术部署DeepSeek,在96块H100GPU上实现接近官方吞吐量的开源实现。

分类 开源 标签 DeepSeek、 SGLang、 多头潜在注意力机制、 大规模专家并行技术、 混合专家系统、 阿里巴巴云 发表评论

英伟达开源6亿参数的语音识别模型Parakeet TDT 0.6B V2

2025年5月9日8时 作者 NLP工程化

英伟达开源Parakeet TDT 0.6B V2语音识别模型,RTFx 3380排名榜首,具备精准时间戳、智能标点和特殊场景识别能力,支持多种应用场景。

分类 开源 标签 FastConformer、 Parakeet TDT、 RTFx、 TDT解码器、 V2、 语音识别 发表评论

一款可作为 Loom 开源平替的跨平台视频录制工具:Cap

2025年5月8日8时 作者 NLP工程化

一款提供桌面客户端和网页版的视频录制、编辑工具,支持数据自托管,功能包括快速录制屏幕内容、视频编辑等,基于Rust开发,完全开源,性能优越且资源占用低。

分类 开源 标签 CapSoftware、 Railway、 Rust、 未知、 桌面客户端、 网页版 发表评论

Lightricks 发布了他们的开源视频生成模型 LTXV -Video-13B

2025年5月8日8时 作者 NLP工程化

Lightricks 发布开源视频生成模型 LTXV-Video-13B,支持多尺度渲染、高级控制等特性,可完全商业使用。

分类 开源 标签 13B、 Lightricks、 开源、 渲染、 物理真实性、 视频生成模型 发表评论
较早文章
较新文章
← 上一页 页面1 … 页面16 页面17 页面18 … 页面73 下一页 →

2025年 AGI AI AI技术 Anthropic ChatGPT Claude DeepSeek DeepSeek-R1 DeepSeek R1 GitHub GPT-4o LLM Manus Meta OpenAI Python Sam Altman 人工智能 人形机器人 具身智能 大型语言模型 大模型 大语言模型 字节跳动 开源 强化学习 微软 扩散模型 技术创新 智能体 木易 机器学习 深度学习 清华大学 生成式AI 用户体验 百度 腾讯 自然语言处理 英伟达 谷歌 阿里云 阿里巴巴 马斯克

分类

  • 分享
  • 国际
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 资讯
  • 与“硅谷精神之父”凯文·凯利(KK)对话,聊聊一万天后的 AI 产品
  • MiniMax-M1 重磅开源!超越DeepSeek R1,媲美Gemini 2.5 Pro和Claude 4 Opus
  • 这些关于研发提效的深度实践分享,值得每一位开发者关注 AICon
  • 揭秘千卡 GPU 集群如何高效训练多模态大模型:vivo AI 团队实战经验分享|AICon
  • 小扎疯狂挖角 OpenAI、签约跳槽就发7亿奖金,奥特曼痛批:不懂创新,老“复制”人了

2025 年 6 月
一 二 三 四 五 六 日
 1
2345678
9101112131415
16171819202122
23242526272829
30  
« 5 月    

归档

  • 2025 年 6 月
  • 2025 年 5 月
  • 2025 年 4 月
  • 2025 年 3 月
  • 2025 年 2 月
  • 2025 年 1 月
  • 2024 年 12 月
  • 2024 年 11 月

AI新闻 | X平台 | APK反编译 | 京ICP备2024096144号 |
© 2025 每时AI • Built with GeneratePress
 下载我们的APP,AI秒送达!  立即下载
×