TRELLIS:微软、清华、中科大联合开源的高质量3D生成模型
TRELLIS 是一款由微软、清华大学和中国科学技术大学联合开发的开源项目,专注于提供高质量的3D资产生成模型。它支持从文本或图像提示生成各种格式的3D资产,并具备灵活编辑功能。
TRELLIS 是一款由微软、清华大学和中国科学技术大学联合开发的开源项目,专注于提供高质量的3D资产生成模型。它支持从文本或图像提示生成各种格式的3D资产,并具备灵活编辑功能。
TRELLIS是清华大学、中科院和微软联合开源的3D生成方法,支持文本或图片输入,具备高效高质量生成多种3D格式(如辐射场、3D高斯等)、灵活编辑功能的特点。
上海交通大学等联合研发的Light-A-Video技术无需训练即可实现零样本视频重打光,解决了视频编辑中的关键技术难题。该方法利用预训练模型和创新模块确保光照一致性和稳定性。
仅用1.44M参数量实现了通用AI图片检测,研究团队提出SAFE方法,在33个测试子集上达到96.7%准确率,优于SOTA模型4.5个百分点。
DeepRAG结合检索增强推理和模仿学习解决了复杂查询的挑战,通过马尔可夫决策过程动态决定是否检索外部知识或内部参数推理。
中国科学技术大学张世武教授团队研发出一种具备19自由度的轻质仿生灵巧手,重量仅为0.37千克,能够复现人手级别的功能,适用于上肢截肢患者的手部功能重建与日常生活辅助。
一种名为VideoWorld的模型无需依赖语言模型,仅通过视觉信号学习知识、认知世界,并能执行复杂任务。它利用潜在动态模型高效压缩视频帧间的视觉变化信息,显著提升知识学习效率和效果。