详解Latte 应用于文生视频的DiT模型
随着Sora的成功发布,视频DiT模型得到了大量的关注和讨论,设计稳定的超大规模神经网络一直是视觉生成领域的研究重点,DiT[1]的成功为图像生成的规模化提供了可能性,然而,由于视频数据的高度结构化与复杂性,如何将DiT扩展到视频生成领域却......
Lumina
近年来,随着扩散模型在生成任务中的广泛应用,它们已经成为了生成式人工智能领域的重要组成部分,从StableDiffusion到Sora,这些模型在生成真实图像和视频方面取得了显著成功,标志着从经典UNet架构向基于Transformer的扩......
共1页 3条