-
Sora竟是用这些数据训练的?OpenAI CTO坦白惹众怒
成式AI模型,它学习概率分布并生成新样本,如文本、图像或视频。对于视频,该模型会学习视频帧序列的概率分布,然后生成新的视频帧序列。而为了实现这一点,Sora 需要学习大量的视频数据。 记者:Sora 生成的视频看起来非常逼真,这是否意味着你们用了大量的视频数据来训练它? Mira Murati:是的,我们使用了大量的视频数据来训练 Sora。这些视频数据来自于各种公开可用的和许可的资源,包括一些大型视频数据库和在线平台。 记者:能否具体透露一下,你们是否使用了 YouTube、Facebook …