OmniAudio:阿里通义实验室如何用360°视频开启空间音频新纪元?

Omniaudio 是阿里巴巴通义实验室推出的一种从 360° 视频生成空间音频的技术,通过自监督预训练和有监督微调提升性能。它能够直接生成 FOA 音频,并在虚拟现实和沉浸式娱乐中提供真实的 3D 音效体验。

豆包 1.6发布后,我用火山引擎Trae + MCP,仅半天做了一个“秒懂科研”的!

小伙伴们吐槽读Paper耗时耗力,新大模型豆包1.6通过强大推理能力和超长上下文理解能力显著提升论文解读效率。同时,火山引擎AI云原生工具箱简化Agent开发流程,仅半天时间就能生成高质量的科研智能体PaperAgent。