字节跳动
字节视频基础大模型发布!单GPU就可生成1080P,蒋路领衔Seed视频团队曝光
字节最新视频生成模型Seaweed-Video仅70亿参数,实现超越同类140亿参数效果。它能根据文本描述创建各种分辨率和时长的视频,并支持图像生成、控制功能增强等新特性。
字节跳动刚发布 Seed-Thinking-v1.5 的技术细节报告
字节跳动发布Seed-Thinking-v1.5技术细节报告,其性能接近Gemini-2.5-Pro和O3-mini-high水平。
在线教程丨字节开源 InfiniteYou 图像生成框架,实现高保真面部特征迁移
InfiniteYou 是字节跳动团队推出的身份保持图像生成框架,通过扩散变压器技术确保面部特征在不同场景中的保留。其核心创新InfuseNet提升了身份保真度,并解决了图文对齐偏差和生成质量不佳的问题。HyperAI超神经提供教程及Demo演示。
字节开源AI图像模型UNO:一个模型统一多个任务,开启更强大的可控生成能力
UNO 是字节跳动开源的研究成果,是一个可以同时支持单主体和多主体图像生成的AI模型。它解决了当前AI图像生成领域的数据扩展和主体扩展问题,并展示了强大的泛化能力,能够适应多种应用场景。
赢麻了!全体程序员彻底狂欢吧!这个好消息来得太及时!
阿里云等企业全面接入AI技术,要求员工掌握大模型开发能力。传统开发框架面临淘汰,AI相关岗位需求暴增且薪资上涨。知乎知学堂推出免费课程,涵盖大模型原理、应用技术和实战经验,助力学员从开发者转型为大模型应用开发工程师。
字节开源MegaTTS3-轻量高效语音合成模型,Wan 团队开源 All-in-One 视频编辑框架 VACE
本文介绍了五种新兴的人工智能技术与系统:轻量级高效语音合成模型MegaTTS3、集视频创作与编辑于一体的AI模型VACE、半自动科学发现系统CodeScientist、终端AI编程助手Gemini Code,以及基于多智能体的医疗问诊框架hospital_multiagent_system。