近日,AI生成视频技术成为了行业内备受瞩目的焦点。立尚传媒作为贵州地区颇具影响力的传媒公司,也在密切关注这一前沿技术的发展。
在Sora等模型出现之后,视频生成领域看似热闹非凡,但实际上存在着一些问题。目前的AI视频生成模型,大多只能生成“看起来像视频”的像素序列,对物理规律的理解还十分欠缺。比如手指数量异常、物体穿模等现象屡见不鲜,视频的逻辑连贯性往往难以超过5秒。
不过,这并不意味着AI生成视频毫无用武之地。它在一些短、平、快的场景中有着独特的优势,例如制作动态表情包或广告素材。就像一个只会模仿动作的哑剧演员,AI视频生成技术能够模仿一些简单的动作,但在复杂的场景中就显得力不从心。
从技术本质上来说,当前的AI视频生成是基于时空上的像素预测,而非物理引擎模拟。因此,在实际应用中,可控性是关键。目前纯Text - to - Video的方式不可控,需要结合Image - to - Video(首帧控制)或Pose - to - Video(动作控制,如ControlNet for Video)等方法来提升可控性。
在具体的工作流方面,一种有效的方式是先用Midjourney生成分镜图,再用Runway Gen - 3或Pika让图片动起来,最后用Topaz Video AI提升分辨率和帧率。而在技术栈上,Stable Video Diffusion (SVD) 和AnimateDiff等开源技术成为了行业的主力。
立尚传媒认为,虽然AI生成视频技术目前还存在一定的局限性,但随着技术的不断发展和完善,它在传媒领域的应用前景十分广阔。未来,立尚传媒也将积极探索AI生成视频技术在公司业务中的应用,为客户提供更优质、更具创意的传媒服务。