狂揽2.6k stars,MonkeyOCR-3B在英文文档解析任务上超越72B模型,性能达SOTA
华中科技大学联合金山办公推出文档解析模型MonkeyOCR,在处理包含公式和表格的复杂文档时表现出色,提升了15.0%和8.6%的性能。
华中科技大学联合金山办公推出文档解析模型MonkeyOCR,在处理包含公式和表格的复杂文档时表现出色,提升了15.0%和8.6%的性能。
「FramePack 低显存视频生成 Demo」已上线至 HyperAI超神经官网的教程板块。FramePack 压缩了输入帧的上下文信息,仅需6GB显存即可生成120秒全帧率视频,解决了传统视频生成中显存占用高、漂移和遗忘等问题。
字节跳动 Intelligent Creation 团队推出的 UNO 模型解决了多主体生成任务中的挑战,利用扩散 Transformer 模型的上下文生成能力,在 DreamBench 和多主体驱动生成基准测试中取得了最佳效果。教程已上线至 HyperAI超神经官网的教程板块,支持用户快速体验 UNO 的通用定制化图像生成功能。