免费开源的吉卜力风格图像神器,小模型掀起大浪潮!效果毫不逊色于GPT-4o!
一款名为EasyControl Ghibli的开源替代方案横空出世,它基于Diffusion Transformer(DiT)架构,免费提供Ghibli风格图像生成功能,支持上传个人照片融入动画宇宙。
一款名为EasyControl Ghibli的开源替代方案横空出世,它基于Diffusion Transformer(DiT)架构,免费提供Ghibli风格图像生成功能,支持上传个人照片融入动画宇宙。
一款名为BabelDOC的GitHub开源工具专为科学论文设计,可以在保留原文格式的同时生成双语对照版本,提升外语论文阅读效率。
清华大学和海天瑞声联合开源的Dolphin语音识别模型专为东方语言设计,支持40种东方语言和22种汉语方言,其small版本仅为Whisper large v3大小的一半,却提高了54.1%的平均字错率。
一款完全自动化、零代码的 LLM 智能体框架 AutoAgent 由香港大学 HKUDS 团队开发并开源,目标是让 AI 开发无门槛。它支持三种使用模式和两种交互模式,内置向量数据库强化 AI 记忆能力。适用于智能搜索、数据分析、信息处理等场景,用户只需用日常语言描述需求即可生成智能助手。
Cua 是由 trycua 团队开发的 macOS 上的开源 AI Agent 框架,支持虚拟化运行 macOS 和 Linux 系统,并且能够使用 OpenAI 和 Anthropic 的 CUA 模型进行操作。它提供高性能虚拟化、安全隔离和多应用支持等特性。
MegaTTS3 是字节跳动最新开源的 TTS 模型,仅 0.45B 参数,在普通设备上流畅运行并生成自然逼真的语音。它支持中英文混合场景和口音控制。
RuoYi AI 提供了一个开箱即用的开源解决方案,涵盖了前端应用、后台管理、小程序等多个方面,支持多模态功能和多种大语言模型集成。通过Java 17和Spring Boot技术栈开发,它简化了开发者搭建AI助手平台的过程。
Second Me 是Mindverse团队开发的开源AI分身框架,采用本地训练和去中心化架构保护用户数据隐私。它通过个性化AI训练、去中心化AI网络等功能设计助力解决实际问题。
字节跳动推出的InfiniteYou AI图像生成工具能够保留人物身份特征的同时灵活修改图像,支持即插即用设计,并提供增强插件提升图像真实感和清晰度。