图像生成迎来CoT时刻!港中文首次提出文生图的o1推理和inference scaling新范式!
香港中文大学、北京大学和上海AI Lab的研究者提出了一种结合思维链推理的新方法来提升自回归图像生成的质量和文本一致性,显著提高了图像生成的性能。
香港中文大学、北京大学和上海AI Lab的研究者提出了一种结合思维链推理的新方法来提升自回归图像生成的质量和文本一致性,显著提高了图像生成的性能。
DeepSeek团队发布创新型多模态框架Janus-Pro,支持384×384图像输入,表现超越现有统一模型,在GenEval和DPG-Bench测试中胜过DALL-E 3和Stable Diffusion。
1月28日凌晨,人工智能社区Hugging Face发布了开源多模态AI模型Janus-Pro。它在多个基准测试中击败了OpenAI和Stable Diffusion,展示了强大的文本到图像生成能力。