當前位置: 妍妍網 > 資訊

李飛飛對話輝達首席科學家:Sora 可以生成電影,但無法替代宮崎駿創造的感動

2024-03-20資訊

責編 | 沭七

出品丨AI 科技大本營(ID:rgznai100)

在昨晚備受矚目的 GTC 爐邊談話中,李飛飛與輝達首席科學家 Bill Dally 圍繞 AI 的發展、人類在 AI 時代的角色定義、李飛飛的新書等話題展開了令人觸動的對話。

Bill Dally(左)與李飛飛(右)

如果說去年的 GTC 爐邊談話,黃仁勛與 OpenAI 首席科學家 Illya 進行的是一場對技術未來的漫談,那今年這場爐邊談話就是李飛飛對人類未來的呼籲。

在對話中,李飛飛講了個故事:在她完成自傳【我看到的世界】的初稿後,她的好朋友,哲學家、史丹佛以人為本 AI 研究院聯合主任 John Etchemendy 看了後建議她去重寫。

他說很多人都在寫關於 AI 的書,但李飛飛有一段獨特的歷程,能代表很多覺得自己在 AI 領域沒有發言權或找不到認同感的人——包括移民、年輕女性、各行各業的人,他們不一定是典型的矽谷 AI 人士,如果李飛飛可以給他們傳達一個聲音,這將帶來更多力量。

確實,李飛飛廣為人知的一面是史丹佛大學終身教授,美國工程學院院士,AI 視覺領域的頂尖專家,被業內稱為 AI 教母。

而她個人的另一面則是出生在北京,長於四川,直到 12 歲才隨雙親前往美國,還因生活拮據不得不去餐館打工賺取生活費。這就是 John Etchemendy 提到的關於李飛飛的「獨特的經歷」。

【我看見的世界:李飛飛自傳】(封面暫定)

在整場對談中,李飛飛都在用一種很獨特的視角來思考 AI 的影響和發展,給在 AI 時代失語的普通人發聲。在李飛飛看來,所有 AI 的發展都是關於人,關於具體的人。

這是一種更有人文情懷的,更具社會責任,也更女性細膩的視角。正如她在自傳【我看見的世界:李飛飛自傳】中所展現出的力量一樣。

以下文章整理自 2024 GTC 爐邊訪談:

相信 AI 會帶來好的未來

Bill Dally: 歡迎大家,感謝來到 GTC。我相信大家和我一樣,都對李飛飛教授要說的話充滿期待。你是史丹佛以人為本 AI 研究院( HAI Stanford )的聯合創始人。到目前為止,你認為 AI 對人類影響最大的領域是什麽?你認為未來 AI 將在哪些領域產生最大影響?

李飛飛: 這是一個非常宏大的問題。首先,非常榮幸受邀來到 GTC。AI 目前對人類的影響是什麽?我認為 AI 可能是 21 世紀最深刻的技術 ,它正在改變我們的生活、工作和未來。AI 是一種智慧技術。在這之前,人類的技術發明大多停留在不涉及智慧的層面,無論是發明工具讓我們走得更快、飛得更高,還是發明工具讓我們能看到人眼看不到的東西,這些都還是機械性的。但 AI 的發明,如理解語言、轉譯語言、做決策、發現模式等,這些都是人類的基本能力,而現在都受到了這項深刻技術的挑戰。所以在我看來,AI 的影響是對人類的本質、能力和定義的深刻影響。

在我擔任谷歌雲首席科學家時,我就看到商業分析是 AI 的一大套用領域。在醫療、交通、教育、軟體工程等領域,AI 的影響將是無邊無際的。

Bill Dally: 一些業界名人如埃隆·馬斯克和山姆·阿特曼認為 AI 可能對人類構成生存威脅。你怎麽看?你認為 AI 可能帶來的最大風險是什麽?

李飛飛: 我認為這是一個合理的問題。作為大學裏的人,尤其是在大學校園工作,我們應該被允許提出各種問題,包括 AI 是否對人類構成生存威脅。從智力角度來說,這是一個重要的關於未來的問題。

作為一個物種,人類應該認識到,我們發明的一切,不僅是 AI,還包括我們正在改變地球的方式,改變我們與環境的關系的方式,都需要我們審慎對待。但 就 AI 而言,我更關註更直接和緊迫的災難性風險。 你提到的一些風險是深層次的社會問題。例如,AI 可能因為錯誤資訊而影響民主,可能取代工作或改變勞動力市場格局,可能影響我們與數據的關系、私密和公平性。如果我們不能很好地管理這項技術的套用,所有這些都可能帶來災難性的社會風險。

Bill Dally: 你最近寫了一本關於 AI 的科學回憶錄【我看見的世界:李飛飛自傳】,我這裏有一本。大家現在應該都從亞馬遜上訂購這本書。你能告訴我們一些關於這本書的情況嗎?你為什麽要寫這本書?

李飛飛: 【我看見的世界:李飛飛自傳】,這本書是一本科學回憶錄。就像你說的,我把「科學」這個詞放在第一位。這本書有一個雙螺旋結構,透過我作為一名電腦視覺科學家的視角講述了 AI 的發展歷程。我看到智慧在自然界的前進演化始於對世界的感知。在過去十幾年裏,AI 的前進演化,特別是深度學習的歷史,與電腦視覺這個領域的前進演化緊密交織在一起。所以這本書講了 AI 在過去十年左右的發展歷程,同時也與一個年輕科學家的個人成長歷程交織在一起。

我之所以覺得有必要寫這本書,是因為我被要求寫一本關於 AI 的科普書,我確實花了一年時間寫了一本只關於 AI 的書。但我們的好朋友 —— 哲學家、史丹佛以人為本 AI 研究院聯合主任任 John Etchemendy 看了我的初稿,基本上說我應該重寫。我當時非常沮喪。他說很多人都在寫關於 AI 的書,但你有一段獨特的歷程。 你代表了很多覺得自己在 AI 領域沒有發言權或找不到認同感的人。 這些人包括移民、年輕女性、各行各業的人,他們不一定是典型的矽谷 AI 人士。如果你能給他們一個聲音,這將更有力量。因此,我把這本書的結構改成了雙螺旋結構。

Bill Dally: 非常有趣。AI 的發展歷程與你作為一名科學家的成長歷程交織在一起。假設 AI 在十年後變得成熟的話,如果你要為這本書寫一個續集,你認為它會是什麽樣的?

李飛飛: 首先,我不認為我想寫續集。如果我要為這本書寫續集,我想寫一個人類勝利的故事。我要講述我們如何利用這項技術讓生活和工作變得更好。我這麽說並不是出於盲目的樂觀,因為我知道世界非常復雜。對年輕人來說,這個世界有時甚至感覺有點反烏托邦。但如果你看人類文明的發展歷程,它是很長的。正如馬丁·路德·金所說, 如果我們能以正確的方式使用技術,人類文明的弧線是朝著正義、希望、仁愛的方向發展的。

就像在這次 GTC 大會上,我們只是看到了( 技術改變生活的 )冰山一角。我們看到了如何利用這項技術改變醫療,從藥物發現到個人化治療再到醫療服務。我們才剛剛開始思考教育如何從根本上被改變,因為突然之間我們有了一個教學助手,可以進行深度個人化學習和教學。我們看到,科學發現可以在強大的機器和認知助手的幫助下加速,這些助手可以真正加速人類已經進行了數百年的科學發現過程。所有這些都給了我們希望之光,希望我們在五到十年內能利用 AI 尋找氣候解決方案,普及醫療服務,照顧好地球和我們自己。

如果我要寫續集,我想寫的就是這些。

AI 永遠無法替代人性感知

Bill Dally: 非常令人興奮的未來似乎已經到來。我們已經看到模型從早期 ImageNet 時代的 ContralNets,到用於語言的 RNN,再到 Transformer,發展得非常快。接下來會是什麽?或者 你認為未來我們的主導網路模型會是什麽?

你認為基礎模型是會出現在世界層面上?也就是說我們可以問它任何關於世界的問題,而它會以多模態四維格式回答我們嗎?

李飛飛: 目前最新的是擴散模型。 但我認為,首先, 我繼續相信數據的縮放定律( Scaling Law )。 我認為我們還沒有看到這方面的終點。關於我們是否已經看到了語言數據的極限有很多猜測,但我不知道答案,因為我不從事語言領域的工作。

從根本上說,語言是一個一維結構。而我從事視覺工作。它從根本上是三維的。如果加上時間,就是四維的。三維結構要豐富得多,但也復雜得多。

當我們用大數據進行擴充套件時,如果是完全盲目的擴充套件,那麽我想輝達會很高興,你們會賣出更多芯片。但我想看到的是結構化建模,或著說偏向於三維感知和結構的模型與大數據相結合。我認為,要真正創造出空間智慧,創造出我們今天仍然缺乏的世界模型。

我確實認為基礎模型會出現在世界層面。我認為你不需要只是問它問題。 這是一種以語言為中心的互動方式。我認為實際上你應該可以與它互動。

看看人類,或者生物體,作為一個電腦視覺人,我想提醒大家一件事,自然花了 5.4 億年的時間來創造感知大腦。而 創造語言,大腦只花了幾十萬年 。所以感知是非常非常深刻的。

Bill Dally: 這是一個很好的觀點——感知領先語言幾百萬年。或者說感知更難,所以需要更長時間。人們對 AI 的一個擔憂是它會擾亂就業市場。你可以說它會創造就業機會,也可能使其他工作變得不那麽重要。你認為 什麽樣的人類工作是 AI 或機器人永遠無法取代的?

李飛飛: 這是一個很棒的問題,也是一個危險的問題。自人類文明伊始,我們的祖先想象過的每一種工作基本上都是由機器協作完成的,像移動、飛行、計算等等。

工作的定義是什麽?如果工作是一項任務,比如抓起某樣東西或做一個煎蛋,我想它會被機器完成。但如果工作是人性的一部份,是定義我們創造力的一部份,定義我們的獨特性,定義我們的意圖、我們的同情心、我們與他人獨特的情感聯系,以及我們每個人對他人或對社會可能產生的獨特貢獻,那麽我認為這些永遠不會被完全取代。我們會利用機器來幫助我們更好地完成這類工作。我沒有看到一個根本性的取代。

讓我們再次回到醫療保健領域,我花了幾十年時間在醫院裏照顧我年邁的父母。每次我帶著父母走進病房,我都會看著人類照顧人類,或者人類需要人類來照顧人類。在這種關系和互動中有一些非常深刻的東西,是任何機器人、AI、電腦、AR/VR,或者你認為的任何下一代技術都無法完全取代的。

在人性方面,在人與人的互動方面,有太多超越了計算、計算、機械的東西,我認為這些將是會保留下來並不斷演變的工作。我們將越來越多地被機器賦予超能力,但作為人類的核心不會被取代。

Bill Dally: 剛才你講到了人類的同理心、情感聯系、關懷還有創造力。創造力是人類的核心特質,但如果我們選擇訓練 AI 模型具有這些特征,我們能做到嗎?我們可以建立有同情心的 AI 模型,讓它能夠在情感上與人聯系嗎?

李飛飛: 在某種程度上可以。我再次強調一下,我從事電腦視覺工作。現在已經有了深度創造性的文本到影像以及文本到視訊的生成(模型)。但我也認為,就像這裏沒有人能預測下一個愛因史坦會是誰一樣,這種創造力以及創造力的不確定性,將永遠存在於我們人類社會中。所以無論你如何訓練機器,你都無法訓練出人類的智慧或人類創造力。

這不僅僅是愛因史坦,還有貝多芬、莎士比亞、梵高。還有太多太多了。而且不一定非要是那麽聰明的人。我自己的孩子,我不認為任何機器都能創造出那樣一個甜美、聰明、幽默的小家夥。

Bill Dally: 這是獨一無二的人性,機器永遠無法取代。說到創造力,生成式 AI 正在做一些了不起的事情。OpenAI 最近推出了 Sora,你可以輸入一個提示,就能得到一個看起來很棒的視訊。也許當你在十年後寫自傳的續集時,是否會發展到如果你想看一部電影,只需寫幾行提示,它就會為你生成一部兩小時的電影?

李飛飛: 我不認為這需要十年,多生產一些 B200,它很快就會出現。就技術而言,我認為這即將到來—— 建立更長時間的生成性世界、生成性故事情節、生成性角色互動的能力指日可待。

Bill Dally: 在這樣一個世界裏,我們有 AI 程式生成大部份內容,那些在好萊塢或遊戲工作室等地方的人類內容創作者的角色是什麽?

李飛飛: 這又回到了人類的獨特性。我不知道你們中有多少人是宮崎駿、吉蔔力工作室的粉絲。他們是最棒的,我就是喜歡一遍又一遍地看他們的電影。從電腦圖形學的角度來看,它相當初級,他們不做皮克斯和夢工廠那樣的(復雜)圖形。然而那些獨特的故事,比如【龍貓】的故事多簡單,那部電影中人性的表達那麽單純,除了宮崎駿,沒有人能創造出那樣的東西。我認為這仍然是人性。 AI 會創作電影,會創作娛樂人們的內容,但只有人,能利用 AI 創作那些能觸動他人、啟發他人或服務他人的內容,AI 做不到。 我確實看到了這種共生的可能性。

「我」在 AI 時代的角色是什麽?

Bill Dally: 你的意思是 AI 基本上會接管這些創意事物的制作部份,制作真正引人註目的視訊,讓影像看起來很棒。但最終在情感層面上與人聯系,去講述一個能讓人流淚的故事,這將是人類應該努力的部份。

李飛飛: 沒錯。這也是我一直強調的一點,就是 在這個機器時代,不要忘記我們的人性,不要忘記我們的尊嚴,不要忘記彼此的尊嚴和人性。這就是我們的核心,這就是我們的獨特之處。這也是我們構建機器套用、使用機器的開端。

Bill Dally: 你還有什麽想傳達給觀眾的嗎?

李飛飛: 我想說的一點是,GTC 是一個特別的會議。你們來到這裏,是因為你們都以某種方式參與了 AI。

當我寫出【我看到的世界】這本書並與全球各地的觀眾,特別是年輕觀眾交談時,我經常被問到的一個問題。而每次有人問這個問題,我仍然會被觸動——那就「我」在這個 AI 時代的角色是什麽?

比如我,我不是電腦科學家,也不是史丹佛大學的理科專業;我不做軟體工程,我不在有電腦的家庭長大的。我熱愛跳舞。但所有這些來自各行各業的人都在問我,他們會在 AI 時代扮演什麽角色。

因為 AI 看起來如此復雜,它有 7000 億個參數,你怎麽用自己的大腦來理解這麽龐大的東西呢?然後是所有這些花哨的詞,Transformer、生成式、擴散式,它們似乎離你每個人都很遙遠。

但我真的想把它歸結為:它是一個工具。它是一個需要一些數學和計算來實作的工具。但歸根結底,人類不僅是工具的創造者,我們也是如何使用工具的決策者;我們是工具套用的創造者,我們也是工具的使用者;我們是決定如何管理工具以及管理想要使用工具的人的選民。所以在參與 AI 方面有很多公民的可能性。

我特別希望年輕人,那些熱愛藝術、熱愛社群、熱愛法律、熱愛醫學、熱愛化學的人,無論你的興趣是什麽,都能以負責任的態度擁抱這項技術,你們實際上可以為讓它變得更好、更好地使用它而有所作為。

這真的是我對每個人的懇求——你們在 AI 開發中是占有一席之地的,請加入我們,讓 AI 變得更好。謝謝!

4 月 25 ~ 26 日,由 CSDN 和高端 IT 咨詢和教育平台 Boolan 聯合主辦的「 全球機器學習技術大會 」將在上海環球港凱悅酒店舉行,特邀近 50 位技術領袖和行業套用專家,與 1000+ 來自電商、金融、汽車、智慧制造、通訊、工業互聯網、醫療、教育等眾多行業的精英參會聽眾,共同探討人工智慧領域的前沿發展和行業最佳實踐。 歡迎所有開發者朋友存取官網 http://ml-summit.org、點選「閱讀原文」或掃碼 進一步了解詳情。