是一个基于文本输入的视频生成模型,用户只需要输入文本,Sora就能将这些文本转化为一段视频。这个特性使得Sora具有极高的灵活性,可以根据用户的需求生成各种类型的视频。此外,Sora还支持多种分辨率和画面比例的选择,可以满足不同场景的需求。然而,Sora目前只支持文本输入,不支持其他输入方式,也没有实现多模态功能。这是Sora的一个重要短板,因为它意味着Sora无法根据非文本的输入生成视频,也无法