AGI-Alpha-Agent-v0:多Agent的AGI项目,致力于从识别到执行的端到端流程
AGI-Alpha-Agent-v0是跨行业多Agent项目,采用MuZero技术提升决策能力,支持云原生和离线运行,涵盖金融、生物、制造等众多领域。
AGI-Alpha-Agent-v0是跨行业多Agent项目,采用MuZero技术提升决策能力,支持云原生和离线运行,涵盖金融、生物、制造等众多领域。
VITA-Audio是一款高效的语音语言模型,显著降低音频生成延迟至53毫秒,并提升推理速度3-4倍。训练数据包含20万小时音频,已开源。
Toolkami 极简AI Agent框架介绍,仅需七个工具构建强大AI Agent,支持热重载和Turbo模式。
来自 Google DeepMind 的 Philipp Schmid 分享的《从零到一:学习代理模式》文章介绍了 3 种工作流模式和 4 种代理模式,适合 AI 代理系统开发者参考。
英伟达开源Parakeet TDT 0.6B V2语音识别模型,RTFx 3380排名榜首,具备精准时间戳、智能标点和特殊场景识别能力,支持多种应用场景。
一款提供桌面客户端和网页版的视频录制、编辑工具,支持数据自托管,功能包括快速录制屏幕内容、视频编辑等,基于Rust开发,完全开源,性能优越且资源占用低。
Lightricks 发布开源视频生成模型 LTXV-Video-13B,支持多尺度渲染、高级控制等特性,可完全商业使用。