日期: 2025 年 3 月 14 日
颤抖吧设计师!谷歌文生图AI爆冲行业:真·用嘴改图,附9大实用案例
Google发布的新工具Gemini(或称Imagen3)在自然语言的理解和材质质感复现方面表现优秀。文章通过四个测试案例详细介绍了其能力边界,包括正方体的材质变换、从手绘稿生成设计渲染图、一次性生成多套不同风格的设计以及抠图换背景打光影等功能。
人类秒懂,AI却懵圈:VLM²-Bench揭示视觉语言模型「视觉关联」能力短板
本文提出VLM²-Bench评测基准,旨在系统探究视觉语言模型在人类级基础视觉线索关联能力上的表现。通过全面考察通用线索、物体线索和人物线索三个大类的基础关联能力,共涵盖9个子任务及3060个测试案例。
一个框解决所有需求?如何用夸克AI超级框实现100个APP的生产力
夸克发布了AI超级框功能,可以直接调用阿里完善的工具基建完成任务。它在健康、影视、学术领域提供了专业的内容搜索,并支持 AI 编程和 PPT 设计等功能。同时拥有强大的模型生态,涵盖多模态信息处理与深度推理能力。
Gemini 好用却不火,这些使用技巧你不该错过,新Flash模型太强了。
Gemini 2.0 Flash Experimental 模型可以生成图片和文本,并且保持角色一致性。作者演示了如何使用该模型创建一个黑暗奇幻风原创 IP 的过程,介绍了其在Google AI Studio上的可用性及一些使用技巧。
AI生成交响乐,这一天终究还是来了
NotaGen 是首个针对古典音乐交响乐的 AI 音乐生成模型,来自中央音乐学院、清华和北航的开发人员宣布其开源。模型涵盖基础版及增强版NotaGen-X,并在专业数据集上进行了微调,实现高度可控性和专业性,提升了古典音乐生成质量。
“我老爸得了MVP”,一个抽象梗如何借AI引爆流量
‘我爸得了MVP’成为新一代抽象热梗,通过AI换脸技术二次创作引发广泛关注。近一个月相关作品在B站和抖音播放量均超过千万,创作者多为低粉UP主。该梗流行背后,不仅依赖于AI工具的易用性和效果提升,更在于其能够引起普通用户与历史人物的情感共鸣。