Sora竟是用这些数据训练的？OpenAI CTO坦白惹众怒

成式AI模型，它学习概率分布并生成新样本，如文本、图像或视频。对于视频，该模型会学习视频帧序列的概率分布，然后生成新的视频帧序列。而为了实现这一点，Sora 需要学习大量的视频数据。

记者:Sora 生成的视频看起来非常逼真，这是否意味着你们用了大量的视频数据来训练它？

Mira Murati:是的，我们使用了大量的视频数据来训练 Sora。这些视频数据来自于各种公开可用的和许可的资源，包括一些大型视频数据库和在线平台。

记者:能否具体透露一下，你们是否使用了 YouTube、Facebook 或 Instagram 上的视频作为训练数据？

Mira Murati:关于具体的训练数据来源，我们确实使用了多种公开可用和许可的数据，但具体到每一个平台，我不能确切地说我们是否使用了 YouTube、Facebook 或 Instagram 上的视频。这些数据是庞大的，并且我们与多个数据源有合作关系。

记者:Shutterstock 是否是你们的训练数据来源之一？

Mira Murati:是的，Shutterstock 是我们的合作伙伴之一，他们为我们提供了一些高质量的图片和视频素材，用于训练我们的模型，包括 Sora。

记者:Sora 的推出日期是什么时候？

Mira Murati:我们正在努力完善 Sora，并计划在今年推出。具体的推出日期还需要根据我们的红队测试进展情况来确定。我们希望能够尽快将 Sora 带给用户，但同时也要确保它的质量和稳定性。

记者:在 Sora 的训练中，有没有遇到什么特别困难或挑战？

Mira Murati:是的，训练 Sora 的确面临了一些挑战。比如，处理手部动作和细节一直是一个难题，因为手部具有非常高的灵活性和复杂性。我们正在努力优化这部分的算法，以提高生成视频的质量和逼真度。

记者:Sora 的优化方向有哪些？

Mira Murati:我们希望通过优化算法和模型架构，进一步提高 Sora 生成视频的质量和效率。同时，我们也希望能够增加用户对视频画面的控制力，让他们能够更精确地指导 Sora 生成符合自己需求的视频。

记者:Sora 是否会加入音频生成的功能？

Mira Murati:音频生成确实是我们考虑的一个方向。虽然目前 Sora 主要专注于视频生成，但我们相信将音频与视频结合，能够为用户带来更加沉浸式的体验。我们正在积极探索这一领域，并希望在未来的版本中能够加入音频生成的功能。

记者:关于 Sora 生成视频的安全性和版权问题，你们将如何解决？

Mira Murati:我们非常重视安全性和版权问题。在推出 Sora 之前，我们将采取一系列措施来确保生成的视频不会侵犯任何版权，并遵循相关的法律法规。同时，我们也会加强模型的安全性，防止恶意利用和滥用。

记者:最后，请对期待 Sora 的用户说些什么吧。

Mira Murati:感谢大家对 Sora 的关注和期待。我们正在努力完善这一产品，并希望能够在今年与大家见面。我们深知用户对高质量、个性化的视频内容有着强烈的需求，Sora 将致力于满足这些需求，并为大家带来全新的视觉体验。请大家保持耐心，并持续关注我们的动态。

在这次采访中，Mira Murati 展示了 OpenAI 对 Sora 项目的深度思考和认真态度。尽管面临一些挑战和争议，但他们仍在努力完善这一产品，并计划在今年推出。对于期待 Sora 的用户来说，这无疑是一个令人振奋的消息。

同时，我们也应该关注到 Sora 所带来的安全性和版权问题。随着技术的不断发展，我们需要在享受技术带来的便利的同时，也要认真思考和解决这些问题，以确保技术的健康发展。

总之，Sora 的出现标志着文生视频技术进入了一个新的阶段。我们期待它在未来能够为用户带来更加精彩和丰富的视觉体验，同时也希望 OpenAI 能够认真面对和解决相关问题，为技术的发展贡献更多的力量。