李飛飛對話輝達首席科學家：Sora 可以生成電影，但無法替代宮崎駿創造的感動

2024-03-20資訊

責編 | 沭七

出品丨AI 科技大本營（ID：rgznai100）

在昨晚備受矚目的 GTC 爐邊談話中，李飛飛與輝達首席科學家 Bill Dally 圍繞 AI 的發展、人類在 AI 時代的角色定義、李飛飛的新書等話題展開了令人觸動的對話。

Bill Dally（左）與李飛飛（右）

如果說去年的 GTC 爐邊談話，黃仁勛與 OpenAI 首席科學家 Illya 進行的是一場對技術未來的漫談，那今年這場爐邊談話就是李飛飛對人類未來的呼籲。

在對話中，李飛飛講了個故事：在她完成自傳【我看到的世界】的初稿後，她的好朋友，哲學家、史丹佛以人為本 AI 研究院聯合主任 John Etchemendy 看了後建議她去重寫。

他說很多人都在寫關於 AI 的書，但李飛飛有一段獨特的歷程，能代表很多覺得自己在 AI 領域沒有發言權或找不到認同感的人——包括移民、年輕女性、各行各業的人，他們不一定是典型的矽谷 AI 人士，如果李飛飛可以給他們傳達一個聲音,這將帶來更多力量。

確實，李飛飛廣為人知的一面是史丹佛大學終身教授，美國工程學院院士，AI 視覺領域的頂尖專家，被業內稱為 AI 教母。

而她個人的另一面則是出生在北京，長於四川，直到 12 歲才隨雙親前往美國，還因生活拮據不得不去餐館打工賺取生活費。這就是 John Etchemendy 提到的關於李飛飛的「獨特的經歷」。

【我看見的世界：李飛飛自傳】（封面暫定）

在整場對談中，李飛飛都在用一種很獨特的視角來思考 AI 的影響和發展，給在 AI 時代失語的普通人發聲。在李飛飛看來，所有 AI 的發展都是關於人，關於具體的人。

這是一種更有人文情懷的，更具社會責任，也更女性細膩的視角。正如她在自傳【我看見的世界：李飛飛自傳】中所展現出的力量一樣。

以下文章整理自 2024 GTC 爐邊訪談：

相信 AI 會帶來好的未來

Bill Dally： 歡迎大家，感謝來到 GTC。我相信大家和我一樣，都對李飛飛教授要說的話充滿期待。你是史丹佛以人為本 AI 研究院（ HAI Stanford ）的聯合創始人。到目前為止，你認為 AI 對人類影響最大的領域是什麽？你認為未來 AI 將在哪些領域產生最大影響？

李飛飛： 這是一個非常宏大的問題。首先，非常榮幸受邀來到 GTC。AI 目前對人類的影響是什麽？我認為 AI 可能是 21 世紀最深刻的技術 ，它正在改變我們的生活、工作和未來。AI 是一種智慧技術。在這之前，人類的技術發明大多停留在不涉及智慧的層面，無論是發明工具讓我們走得更快、飛得更高，還是發明工具讓我們能看到人眼看不到的東西，這些都還是機械性的。但 AI 的發明，如理解語言、轉譯語言、做決策、發現模式等，這些都是人類的基本能力，而現在都受到了這項深刻技術的挑戰。所以在我看來，AI 的影響是對人類的本質、能力和定義的深刻影響。

在我擔任谷歌雲首席科學家時，我就看到商業分析是 AI 的一大套用領域。在醫療、交通、教育、軟體工程等領域，AI 的影響將是無邊無際的。

Bill Dally： 一些業界名人如埃隆·馬斯克和山姆·阿特曼認為 AI 可能對人類構成生存威脅。你怎麽看？你認為 AI 可能帶來的最大風險是什麽？

李飛飛： 我認為這是一個合理的問題。作為大學裏的人，尤其是在大學校園工作，我們應該被允許提出各種問題，包括 AI 是否對人類構成生存威脅。從智力角度來說，這是一個重要的關於未來的問題。

作為一個物種，人類應該認識到，我們發明的一切，不僅是 AI，還包括我們正在改變地球的方式，改變我們與環境的關系的方式，都需要我們審慎對待。但 就 AI 而言，我更關註更直接和緊迫的災難性風險。 你提到的一些風險是深層次的社會問題。例如，AI 可能因為錯誤資訊而影響民主，可能取代工作或改變勞動力市場格局，可能影響我們與數據的關系、私密和公平性。如果我們不能很好地管理這項技術的套用，所有這些都可能帶來災難性的社會風險。

Bill Dally： 你最近寫了一本關於 AI 的科學回憶錄【我看見的世界：李飛飛自傳】，我這裏有一本。大家現在應該都從亞馬遜上訂購這本書。你能告訴我們一些關於這本書的情況嗎？你為什麽要寫這本書？

李飛飛： 【我看見的世界：李飛飛自傳】，這本書是一本科學回憶錄。就像你說的，我把「科學」這個詞放在第一位。這本書有一個雙螺旋結構，透過我作為一名電腦視覺科學家的視角講述了 AI 的發展歷程。我看到智慧在自然界的前進演化始於對世界的感知。在過去十幾年裏，AI 的前進演化，特別是深度學習的歷史，與電腦視覺這個領域的前進演化緊密交織在一起。所以這本書講了 AI 在過去十年左右的發展歷程，同時也與一個年輕科學家的個人成長歷程交織在一起。

我之所以覺得有必要寫這本書，是因為我被要求寫一本關於 AI 的科普書，我確實花了一年時間寫了一本只關於 AI 的書。但我們的好朋友 —— 哲學家、史丹佛以人為本 AI 研究院聯合主任任 John Etchemendy 看了我的初稿，基本上說我應該重寫。我當時非常沮喪。他說很多人都在寫關於 AI 的書，但你有一段獨特的歷程。 你代表了很多覺得自己在 AI 領域沒有發言權或找不到認同感的人。 這些人包括移民、年輕女性、各行各業的人，他們不一定是典型的矽谷 AI 人士。如果你能給他們一個聲音，這將更有力量。因此，我把這本書的結構改成了雙螺旋結構。

Bill Dally： 非常有趣。AI 的發展歷程與你作為一名科學家的成長歷程交織在一起。假設 AI 在十年後變得成熟的話，如果你要為這本書寫一個續集，你認為它會是什麽樣的？

李飛飛： 首先，我不認為我想寫續集。如果我要為這本書寫續集，我想寫一個人類勝利的故事。我要講述我們如何利用這項技術讓生活和工作變得更好。我這麽說並不是出於盲目的樂觀，因為我知道世界非常復雜。對年輕人來說，這個世界有時甚至感覺有點反烏托邦。但如果你看人類文明的發展歷程，它是很長的。正如馬丁·路德·金所說， 如果我們能以正確的方式使用技術，人類文明的弧線是朝著正義、希望、仁愛的方向發展的。

就像在這次 GTC 大會上，我們只是看到了（技術改變生活的）冰山一角。我們看到了如何利用這項技術改變醫療，從藥物發現到個人化治療再到醫療服務。我們才剛剛開始思考教育如何從根本上被改變，因為突然之間我們有了一個教學助手，可以進行深度個人化學習和教學。我們看到，科學發現可以在強大的機器和認知助手的幫助下加速，這些助手可以真正加速人類已經進行了數百年的科學發現過程。所有這些都給了我們希望之光，希望我們在五到十年內能利用 AI 尋找氣候解決方案，普及醫療服務，照顧好地球和我們自己。

如果我要寫續集，我想寫的就是這些。

AI 永遠無法替代人性感知

Bill Dally： 非常令人興奮的未來似乎已經到來。我們已經看到模型從早期 ImageNet 時代的 ContralNets，到用於語言的 RNN，再到 Transformer，發展得非常快。接下來會是什麽？或者 你認為未來我們的主導網路模型會是什麽？

你認為基礎模型是會出現在世界層面上？也就是說我們可以問它任何關於世界的問題，而它會以多模態四維格式回答我們嗎？

李飛飛： 目前最新的是擴散模型。 但我認為，首先， 我繼續相信數據的縮放定律（ Scaling Law ）。 我認為我們還沒有看到這方面的終點。關於我們是否已經看到了語言數據的極限有很多猜測，但我不知道答案，因為我不從事語言領域的工作。

從根本上說，語言是一個一維結構。而我從事視覺工作。它從根本上是三維的。如果加上時間，就是四維的。三維結構要豐富得多，但也復雜得多。

當我們用大數據進行擴充套件時，如果是完全盲目的擴充套件，那麽我想輝達會很高興，你們會賣出更多芯片。但我想看到的是結構化建模，或著說偏向於三維感知和結構的模型與大數據相結合。我認為，要真正創造出空間智慧，創造出我們今天仍然缺乏的世界模型。

我確實認為基礎模型會出現在世界層面。我認為你不需要只是問它問題。 這是一種以語言為中心的互動方式。我認為實際上你應該可以與它互動。

看看人類，或者生物體，作為一個電腦視覺人，我想提醒大家一件事，自然花了 5.4 億年的時間來創造感知大腦。而 創造語言，大腦只花了幾十萬年 。所以感知是非常非常深刻的。

Bill Dally： 這是一個很好的觀點——感知領先語言幾百萬年。或者說感知更難，所以需要更長時間。人們對 AI 的一個擔憂是它會擾亂就業市場。你可以說它會創造就業機會，也可能使其他工作變得不那麽重要。你認為 什麽樣的人類工作是 AI 或機器人永遠無法取代的？

李飛飛： 這是一個很棒的問題，也是一個危險的問題。自人類文明伊始，我們的祖先想象過的每一種工作基本上都是由機器協作完成的，像移動、飛行、計算等等。

工作的定義是什麽？如果工作是一項任務，比如抓起某樣東西或做一個煎蛋，我想它會被機器完成。但如果工作是人性的一部份，是定義我們創造力的一部份，定義我們的獨特性，定義我們的意圖、我們的同情心、我們與他人獨特的情感聯系，以及我們每個人對他人或對社會可能產生的獨特貢獻，那麽我認為這些永遠不會被完全取代。我們會利用機器來幫助我們更好地完成這類工作。我沒有看到一個根本性的取代。

讓我們再次回到醫療保健領域，我花了幾十年時間在醫院裏照顧我年邁的父母。每次我帶著父母走進病房，我都會看著人類照顧人類，或者人類需要人類來照顧人類。在這種關系和互動中有一些非常深刻的東西，是任何機器人、AI、電腦、AR/VR，或者你認為的任何下一代技術都無法完全取代的。

在人性方面，在人與人的互動方面，有太多超越了計算、計算、機械的東西，我認為這些將是會保留下來並不斷演變的工作。我們將越來越多地被機器賦予超能力，但作為人類的核心不會被取代。

Bill Dally： 剛才你講到了人類的同理心、情感聯系、關懷還有創造力。創造力是人類的核心特質，但如果我們選擇訓練 AI 模型具有這些特征，我們能做到嗎？我們可以建立有同情心的 AI 模型，讓它能夠在情感上與人聯系嗎？

李飛飛： 在某種程度上可以。我再次強調一下，我從事電腦視覺工作。現在已經有了深度創造性的文本到影像以及文本到視訊的生成（模型）。但我也認為，就像這裏沒有人能預測下一個愛因史坦會是誰一樣，這種創造力以及創造力的不確定性，將永遠存在於我們人類社會中。所以無論你如何訓練機器，你都無法訓練出人類的智慧或人類創造力。

這不僅僅是愛因史坦，還有貝多芬、莎士比亞、梵高。還有太多太多了。而且不一定非要是那麽聰明的人。我自己的孩子，我不認為任何機器都能創造出那樣一個甜美、聰明、幽默的小家夥。

Bill Dally： 這是獨一無二的人性，機器永遠無法取代。說到創造力，生成式 AI 正在做一些了不起的事情。OpenAI 最近推出了 Sora，你可以輸入一個提示，就能得到一個看起來很棒的視訊。也許當你在十年後寫自傳的續集時，是否會發展到如果你想看一部電影，只需寫幾行提示，它就會為你生成一部兩小時的電影？

李飛飛： 我不認為這需要十年，多生產一些 B200，它很快就會出現。就技術而言，我認為這即將到來—— 建立更長時間的生成性世界、生成性故事情節、生成性角色互動的能力指日可待。

Bill Dally： 在這樣一個世界裏，我們有 AI 程式生成大部份內容，那些在好萊塢或遊戲工作室等地方的人類內容創作者的角色是什麽？

李飛飛： 這又回到了人類的獨特性。我不知道你們中有多少人是宮崎駿、吉蔔力工作室的粉絲。他們是最棒的，我就是喜歡一遍又一遍地看他們的電影。從電腦圖形學的角度來看，它相當初級，他們不做皮克斯和夢工廠那樣的（復雜）圖形。然而那些獨特的故事，比如【龍貓】的故事多簡單，那部電影中人性的表達那麽單純，除了宮崎駿，沒有人能創造出那樣的東西。我認為這仍然是人性。 AI 會創作電影，會創作娛樂人們的內容，但只有人，能利用 AI 創作那些能觸動他人、啟發他人或服務他人的內容，AI 做不到。 我確實看到了這種共生的可能性。

「我」在 AI 時代的角色是什麽？

Bill Dally： 你的意思是 AI 基本上會接管這些創意事物的制作部份，制作真正引人註目的視訊，讓影像看起來很棒。但最終在情感層面上與人聯系，去講述一個能讓人流淚的故事，這將是人類應該努力的部份。

李飛飛： 沒錯。這也是我一直強調的一點，就是在這個機器時代，不要忘記我們的人性，不要忘記我們的尊嚴，不要忘記彼此的尊嚴和人性。這就是我們的核心，這就是我們的獨特之處。這也是我們構建機器套用、使用機器的開端。

Bill Dally： 你還有什麽想傳達給觀眾的嗎？

李飛飛： 我想說的一點是，GTC 是一個特別的會議。你們來到這裏，是因為你們都以某種方式參與了 AI。

當我寫出【我看到的世界】這本書並與全球各地的觀眾，特別是年輕觀眾交談時，我經常被問到的一個問題。而每次有人問這個問題，我仍然會被觸動——那就「我」在這個 AI 時代的角色是什麽？

比如我，我不是電腦科學家，也不是史丹佛大學的理科專業；我不做軟體工程，我不在有電腦的家庭長大的。我熱愛跳舞。但所有這些來自各行各業的人都在問我，他們會在 AI 時代扮演什麽角色。

因為 AI 看起來如此復雜，它有 7000 億個參數，你怎麽用自己的大腦來理解這麽龐大的東西呢？然後是所有這些花哨的詞，Transformer、生成式、擴散式，它們似乎離你每個人都很遙遠。

但我真的想把它歸結為：它是一個工具。它是一個需要一些數學和計算來實作的工具。但歸根結底，人類不僅是工具的創造者，我們也是如何使用工具的決策者；我們是工具套用的創造者，我們也是工具的使用者；我們是決定如何管理工具以及管理想要使用工具的人的選民。所以在參與 AI 方面有很多公民的可能性。

我特別希望年輕人，那些熱愛藝術、熱愛社群、熱愛法律、熱愛醫學、熱愛化學的人，無論你的興趣是什麽，都能以負責任的態度擁抱這項技術，你們實際上可以為讓它變得更好、更好地使用它而有所作為。

這真的是我對每個人的懇求——你們在 AI 開發中是占有一席之地的，請加入我們，讓 AI 變得更好。謝謝！

4 月 25 ~ 26 日，由 CSDN 和高端 IT 咨詢和教育平台 Boolan 聯合主辦的「 全球機器學習技術大會 」將在上海環球港凱悅酒店舉行，特邀近 50 位技術領袖和行業套用專家，與 1000+ 來自電商、金融、汽車、智慧制造、通訊、工業互聯網、醫療、教育等眾多行業的精英參會聽眾，共同探討人工智慧領域的前沿發展和行業最佳實踐。 歡迎所有開發者朋友存取官網 http://ml-summit.org、點選「閱讀原文」或掃碼 進一步了解詳情。