大模型助力分割,刷新10项SOTA!清华和美团提出HyperSeg:通用分割框架

首个基于视觉大语言模型(VLLM)的通用分割模型HyperSeg,能够处理像素级图像和视频感知任务,并具备复杂的推理和对话能力。在多个分割任务中刷新了10项SOTA,展现了卓越性能。

5.5k星星!开源AI漫画翻译神器,有些漫画永远都不会被翻译,因此这个项目诞生了。

一个基于深度学习的漫画图像翻译工具Manga Image Translator,通过OCR技术识别并翻译漫画中的文字,并无缝嵌入原图中。该项目由作者持续更新维护,支持多种语言和功能选项,目前已有良好效果。

汤姆猫AI童伴机器人将于12月21日发售,能识别情绪、主动聊天

汤姆猫官微宣布,公司即将推出AI童伴机器人。专为3-11岁儿童设计,具备情绪识别、主动聊天、双语互动等功能。产品外观使用食品级硅胶材质,内置多套传动装置实现拟人化功能。