AI电影制作:AI驱动的电影是如何诞生的
生成式AI最引人入胜的应用之一是其在电影制作中的使用。我们有机会独家采访了一支处于保密状态的先锋电影制作团队,他们提供了罕见的见解,介绍了他们如何利用AI工具通过两步过程创建视觉上令人惊叹的电影,包括“文本到图像”和“图像到视频”技术。
第一步:文本到图像的创建
初始阶段涉及使用AI将详细的文本描述转换为静态的高质量图像,这些图像作为电影的概念基础。例如,为了可视化一个被植物覆盖的后末日城市,团队将描述性文本输入到Stable Diffusion或MidJourney等AI模型中。这些模型生成生动的概念艺术,显示被蔓延的藤蔓和花朵吞噬的破败建筑,这些图像成为电影的视觉基础。
第二步:图像到视频的转换
一旦图像生成,团队将过渡到图像到视频的过程,使用AI工具来动画这些静态视觉。Flux等模型被用于创建动态序列。例如,随着摄像机穿过废墟城市,花朵绽放和生长,AI增强了环境效果,如飘落的花瓣。制作团队将连续镜头分成更小的片段,以实现对摄像机运动的精确控制,确保180°和270°旋转的无缝集成,模拟沉浸式360°场景。
360°旋转摄像机技术
制作团队使用AI驱动的工具创建复杂的、流畅的镜头,否则这些镜头需要大量的人力。在一个令人难忘的场景中,通过将镜头分成三个部分,实现了角色穿过古老温室的360°全景视图。这使得对光线、深度和运动的渲染更加可控和一致。
AI辅助电影制作的挑战
尽管AI实现了显著的进步,但技术限制仍然存在。团队指出在渲染复杂细节(如真实的水流或精确的人类手势)方面的困难。为了应对这些挑战,团队采用了简化的提示或参考图像,以改善帧之间的过渡平滑度。
严峻的现实:兴趣下降和消费者期望
尽管早期对AI生成视频的兴奋,但最近的数据表明,用户对这些平台的参与度有所下降。早期的炒作已经开始消退,用户越来越倾向于由专业创作者制作的传统高质量视频。AI视频工具往往难以保持时间一致性和真实性,未能满足用户的期望。
AI视频质量的挑战
AI生成的视频虽然在短片中令人印象深刻,但往往存在破坏观看体验的缺陷。用户可以轻松发现动画中的不一致性、不自然的运动或扭曲的纹理,例如手变成不自然的形状或角色动作不流畅。这些问题打破了沉浸感,导致观众迅速离开,尤其是与人类创作者的精致内容相比。目前,AI生成视频的技术限制使其局限于幽默或模仿内容等小众领域,其中缺陷要么被接受,要么被夸大以达到喜剧效果。
AI视频生成的现状类似于AI文本模型早期的发展,当时尚未达到GPT等工具的复杂性。大多数AI生成内容用于娱乐或新奇,而不是严肃的故事讲述。为了获得更广泛的接受,AI生成视频工具需要克服这些技术障碍,并提供在流畅性、真实性和情感深度方面与人类制作视频相媲美的内容。
竞争加剧:OpenAI的Sora与全球竞争对手的战斗
OpenAI期待已久的文本到视频工具Sora面临重大延迟,令AI社区感到沮丧。尽管Sora有可能通过将文本提示转化为高度详细和逼真的视频来革命化视频生成,但它尚未广泛发布。安全问题,包括深度伪造和错误信息的风险,减缓了发布速度,导致OpenAI限制了对选定艺术家和测试人员的访问。
然而,这种谨慎的做法为竞争对手提供了机会。像Kling AI、快手和MiniMax这样的中国公司,以及Meta等西方主要公司,迅速推进了他们自己的AI视频工具。Meta AI的VideoGen和Kling AI等平台正在获得市场份额,成为生成式AI竞赛中的有力竞争者。
Sora的延迟发布
尽管OpenAI的Sora引起了期待,但公众发布的延长时间表导致用户感到沮丧。一些人担心延迟可能会使OpenAI在早期领先地位上失去优势,尤其是随着竞争对手继续推出创新解决方案。Meta和中国科技巨头已经在使用AI驱动的工具进行视频生成,人们对OpenAI不愿更广泛地发布Sora可能导致市场主导地位的丧失感到担忧。
结论:AI生成视频内容的未来
完美AI生成视频内容的竞赛正在升温,西方和中国的科技巨头之间出现了显著竞争。尽管技术取得了显著进展,但挑战依然存在,特别是在实现消费者期望的质量和真实性方面。AI生成视频目前局限于短格式、幽默内容等小众领域,但该行业正处于关键时刻。为了实现主流接受,AI视频工具必须克服技术限制,提供精致的结果,并满足习惯于专业级内容的观众的高期望。
AI生成视频内容的潜力仍然巨大,但其真正的“GPT时刻”尚未到来。随着行业的演变,能够在创新与质量和伦理考虑之间取得平衡的公司可能会成为该领域的领导者。在此之前,AI生成视频将保持新奇,而不是人类制作电影的严肃竞争者。