VITA-Audio:一款高效的语音语言模型,能够快速生成音频和文本内容
VITA-Audio是一款高效的语音语言模型,显著降低音频生成延迟至53毫秒,并提升推理速度3-4倍。训练数据包含20万小时音频,已开源。
VITA-Audio是一款高效的语音语言模型,显著降低音频生成延迟至53毫秒,并提升推理速度3-4倍。训练数据包含20万小时音频,已开源。
Toolkami 极简AI Agent框架介绍,仅需七个工具构建强大AI Agent,支持热重载和Turbo模式。
字节跳动开源流程构建引擎FlowGram,支持固定布局和自由布局,结合AI增强功能简化工作流开发。其特点包括丰富的交互体验、节点控制灵活性、强大的扩展能力和低代码能力。
Xianyu AutoAgent 是专为闲鱼平台打造的AI值守解决方案,实现24小时自动化客服。支持多专家协同决策、智能议价和上下文感知对话,具备上下文管理、情感分析增强等功能模块。
微软开源了三款小参数模型Phi-4 Reasoning、mini版本Phi-4 mini-reasoning和强化学习版本Phi-4 reasoning-plus,算力消耗低,在Windows系统生态中表现突出。