【48812】我国自研视频生成模型CogVideoX首先开源

  企业智谱AI首先将视频生成东西清影背面的视频生成模型CogVideoX开源。这是国内首个开源的视频生成模型。该模型的开源,将逐渐下降视频生成技能的运用门槛。

  CogVideoX开源模型包括多个不一样的尺度的模型,此次开源的CogVideoX-2B模型在FP16的模型精度下推理仅需18GB显存,微调则只需40GB显存,意味着单张4090显卡即可进行推理,单张A6000显卡就可以完结微调。

  开源后的CogVideoX-2B模型,支撑在微调后用于微短剧等视频内容的根本制造。“这一开源模型仅需个人消费级显卡就能进行推理运转,极大下降了模型运用门槛,可以让更多开发者、草创团队、企业开发对自己最合适运用的视频生成模型。”智谱AI首席执行官张鹏介绍。

  CogVideoX-2B模型的提示词上限为226个token,视频长度为6秒,帧率为8帧/秒,视频分辨率为720*480,开发者可在提示词优化,视频长度、帧率、分辨率、场景微调,以及视频功用开发等方面奉献开源力气。

  当时,多个国产自研视频生成东西密布上线,部分国产动画短片已试水运用视频生成技能辅佐创造与制造的过程。业界以为,视频生成模型将在算力、算法、数据驱动下进一步迭代,提高稳定性、可控性、一致性,解锁更多运用空间,推进影视、动画、游戏等工业提质增效。

其他人还喜欢