小兵的AI视界，作者每时AI

快来看！OOTDiffusion—— Xiao-I Research打造的超逼真虚拟试穿神器

下午2时 2025/01/20 作者小兵的AI视界

虚拟试穿技术在时尚电商、个性化定制服务等领域广泛应用，OOMDiffusion通过高度可控和逼真的虚拟试穿体验提升了用户体验。

Hallo 登场！突破传统，音频赋能视觉合成的创新先锋

下午2时 2025/01/19 作者小兵的AI视界

音频驱动的层次化视觉合成工具Hallo通过分层音频驱动视觉合成模块和端到端扩散范式实现了高质量的肖像图像动画生成。其精细的区域划分与同步建模、端到端的特点以及多种预训练模型支持，使其在多媒体内容创作、虚拟人物互动和智能客服等领域具有广泛应用前景。

开源评估利器 VLMEvalKit，搞定多模态大模型评估的秘密武器

下午2时 2025/01/18 作者小兵的AI视界

如今，视觉语言模型（
VLM
）在学术界和工业界到处
“
开花
”
，用处特别多。但这也带来了新麻烦

实用指南：Awesome LLM Apps，轻松搞定各类任务

下午2时 2025/01/17 作者小兵的AI视界

文章介绍了一个名为　awesome-llm-apps　的开源项目，展示了多个基于大型语言模型的应用实例。该项目涵盖RAG技术、智能代理应用以及在金融、内容创作、个人管理、旅行规划和教育科研领域的具体应用场景，强调了这些应用如何帮助用户解决问题并提升工作效率。

阿里 QVQ 模型：多模态推理技术的前沿探索与创新实践

下午2时 2025/01/16 作者小兵的AI视界

在当今人工智能飞速发展的时代，多模态推理成为了研究的热点和前沿领域。阿里云通义千问团队一直致力于推动

Roop：一键式AI换脸，开启你的创意之旅

下午2时 2025/01/15 作者小兵的AI视界

在人工智能技术飞速发展的今天，各种神奇的应用不断涌现，Roop项目便是其中一颗耀眼的明珠。它以其强大

浦语・灵笔 2.5-OL 来袭！多模态大模型技术探秘与超详细部署指南

下午2时 2025/01/14 作者小兵的AI视界

随着人工智能技术的飞速发展，多模态大模型已成为研究的新趋势，它们能够整合视觉、听觉等多种感官信息，提

快手 Kolors Virtual Try-On，可图大模型加持的AI虚拟换衣神器，快来试试你的专属搭配吧！

下午2时 2025/01/13 作者小兵的AI视界

Kolors Virtual Try-On in the Wild 是快手推出的基于大模型可图（Kolors）的 AI 虚拟换衣工具。利用计算机视觉和机器学习技术实现模特无痕换装，提供高精度图像识别、丰富服装数据库等功能，支持用户即时生成试穿效果。该工具广泛应用于在线零售、社交媒体、时尚品牌推广和虚拟时装秀等领域，提升用户体验与营销效果。

震撼！1B 参数 Meissonic 文生图模型，阿里携手高校的重磅之作

下午2时 2025/01/12 作者小兵的AI视界

在当今人工智能蓬勃发展的时代，文本到图像生成技术成为了备受瞩目的焦点领域。众多研究机构与企业纷纷投身

Manga Image Translator：狂揽 5.6k 星的开源 AI 漫画翻译神器

下午10时 2025/01/11 作者小兵的AI视界

漫画广受全球粉丝追捧，可语言差异却成了欣赏佳作的 “拦路虎”。好在 Manga Image Tran

一	二	三	四	五	六	日
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30