Sora 將於今年正式釋出！OpenAI CTO Mira Murati 披露 Sora 未來

2024-03-15資訊

整理 | 沭七

出品丨AI 科技大本營（ID：rgznai100）

視訊生成模型 Sora 的效果驚艷了全球，從宣布至今，我們時常能夠看到各種基於 Sora 生成的視訊在互聯網上流傳，盡管它有一些小瑕疵，但其效果依然引入驚嘆。我們已經迫不及待地想像當初 ChatGPT 釋出一樣能夠立即使用上 Sora，然而在近日，據 OpenAI CTO Mira Murati 在采訪中表示，Sora 目前還在開發和測試階段，OpenAI 計劃在今年內的某個時間釋出 Sora，目前仍在打磨中，且正在進行外部測試。

除了這個釋出時間之外，Mira 還披露了 Sora 的其他幾個關鍵資訊：

關於 Sora 生成視訊的時間：對於 720P 分辨率或 20 秒長視訊，生成時間大概在幾分鐘，這取決於提示的復雜性。

目前視訊依然沒有聲音，但未來 Sora 可能會支持視訊音效。

在 Sora 的訓練之中，Sora 的資料來源是大家頗為關心的問題。當被問及 Sora 訓練的素材是否包括 YouTube、Instagram 和 Facebook 上的視訊時，Mira Murati 的回答是不確定的。她沒有明確確認這些平台的視訊是否被用作訓練數據，稱 Sora 的訓練數據來自公開可用和授權的數據，最後結束後確認訓練封包括 Shutterstock 的內容。

計算資源：Sora 的生成過程相比之前 ChatGPT 需要更多的計算資源，OpenAI 正在致力於最佳化技術，相信未來應該也會和此前 Altman 所講的 GPT 一樣，成本得到大幅降低，最終能夠極大地便於公眾使用。

安全性和可靠性：Sora 目前正在進行紅隊測試（測試工具的安全性、可靠性和缺陷），以辨識潛在的漏洞、偏見和其他有害問題。

內容限制：與 DALL-E 類似，Sora 在生成內容時也會有一些限制，例如不生成公眾人物的影像（但 DALL-E 很神奇的是能夠生成公司 logo ），以避免誤導和濫用。

裸露內容：關於裸露內容的處理，提到 OpenAI 正在與藝術家和創作者合作，以確定工具應該提供的靈活性水平胡合理的限制，但沒有具體提到如何區分藝術和色情的內容。

正在研究對視訊進行浮水印標記，但是相對於浮水印，視訊內容的稽核限制更為重要，因為隨著生成的視訊更加真實，使用者將無法分辨視訊內容的真實性，防止生成誤導內容。

對於 Sora 我們至今依然只能透過它的技術報告論文以及各種討論裏尋找蛛絲馬跡，這也給復現 Sora 帶來了極大的難度。目前國內潞晨科技、北京大學與兔展已初步實作了 Sora 復現的方案並均已開源，並取得了不錯的反饋。除了精準控制這一視訊生成的重要模組之外（ Sora 本身也正在致力於解決精準控制這一問題），對於復現目前面臨的最大難題依然是算力不足和資料來源的需求，從 Mira Murati 的分享中我們也可以一窺其未來方向。

相關資料：

https://www.wsj.com/video/series/joanna-stern-personal-technology/openai-made-me-crazy-videosthen-the-cto-answered-most-of-my-questions/C2188768-D570-4456-8574-9941D4F9D7E2

https://twitter.com/imxiaohu/status/1768138429676835181

https://mp.weixin.qq.com/s/9gNnJxnNnYxMdsLZjvd8OA

4 月 25 ~ 26 日，由 CSDN 和高端 IT 咨詢和教育平台 Boolan 聯合主辦的「 全球機器學習技術大會 」將在上海環球港凱悅酒店舉行，特邀近 50 位技術領袖和行業套用專家，與 1000+ 來自電商、金融、汽車、智慧制造、通訊、工業互聯網、醫療、教育等眾多行業的精英參會聽眾，共同探討人工智慧領域的前沿發展和行業最佳實踐。 歡迎所有開發者朋友存取官網 http://ml-summit.org、點選「閱讀原文」或掃碼 進一步了解詳情。