當前位置: 妍妍網 > 資訊

李飛飛親述:我所遭遇過的性別歧視

2024-03-08資訊

整理 | 唐小引、王啟隆

出品丨AI 科技大本營(ID:rgznai100)

今天是一年一度的女性節日,祝所有在技術世界裏馳騁的女性朋友們節日快樂。

在 AI 界,我們總會想起一位傑出的女性科學家,她就是美國三院院士、史丹佛終身教授李飛飛。關於李飛飛的故事我們聽過許多,人們既驚嘆於她在人工智慧領域的諸多貢獻,又很為她的勵誌故事所感慨萬分。去年 11 月,李飛飛的自傳 The Worlds I See (【我看見的世界】)英文版釋出,其間以她細膩的文筆書寫了自己的成長故事,尤其披露了許多可能不為人知的細節,同時講述了人工智慧領域電腦視覺革命的來龍去脈。值得一提的是,中文版在今年也將與我們見面,由中信出版集團出版。

CSDN 創始人&董事長蔣濤在讀完此書後,發出了如此感慨:「感人至深而意味深長的科學家傳記。人工智慧新時代的到來,是因為李飛飛團隊在ImageNet大規模數據集的工作取得範式突破,讓神經網路演算法煥發出人類大腦的智慧,這一切如何發生的?作者用親身視角展示了突破創造的科學研究,是如何一步步傳承發展,每一階段作者和前沿的科學家們又是如何思考的,如何恰逢其時各種因緣際會而大成。對於有誌於科學研究的青年還有想了解人工智慧如何發展的讀者,這本書都是不可多得的佳作。」

在今天這一特別的日子裏,我們一起走進由李飛飛親自講述的關於她及人工智慧的故事。

年少時光的愛與打擊

李飛飛出生於北京,但在相隔千裏的四川省會成都長大。這裏是她母親的老家,母親在李飛飛的生命裏有著極其重要的影響。 在自傳開篇,李飛飛分享了自己在 2018 年與 OpenAI 聯合創始人 Greg Brockman 等一起參加美國國會聽證會背後的糾結:「我是家裏的獨女,是父母唯一的經濟支柱,同時還要擔任他們與看護人員之間的轉譯。想到這些,我不禁覺得真不該安排這次行程。但是,能出席這次聽證會讓身為移民的母親感到無比驕傲,相比之下,疾病根本不算什麽。在來美國僅僅 20 年後,她竟然可以看到自己的女兒在美國國會發表演講,這樣的機會絕對不能錯過。在我的整個職業生涯中,母親自始至終堅定地支持我,所以我相信她會堅決要求我參加聽證會……母親要求我來參加聽證會是對的。我確信人工智慧未來所依賴的機構範疇遠遠超出科學界,還包括教育機構、行動組織,當然還有政府。」

在李飛飛的生命裏,父母、外祖父母對她有著極為深刻的影響:「外祖父母對我的培養方式也契合了父母的價值觀。他們對我疼愛有加,但我從來不會覺得因為他們寵我,就不會管束我。他們並不認同他們這代人中盛行的重男輕女的觀念,而是跟父母一樣,鼓勵我展開想象,並堅守原則:我首先是個獨立的個體,其次才是個女孩。」

然而年少的李飛飛還是遭遇了一次性別上的打擊,在一個平淡無奇的一天,老師在下課時提出了一個奇怪的要求:女生先回家,男生在座位上多坐幾分鐘。這讓李飛飛好奇了起來,於是在教室門口徘徊,藏在了一個能聽到老師說話的地方。而所聽到的話卻讓她備受打擊、終生難忘。

老師說:「我讓女同學先走,是因為現在我要告訴你們:你們的整體表現是不行的。男孩天生就比女孩聰明,數學和科學就是體現你們腦子靈光的基礎學科。你們的平均成績竟然比女生還低,這種情況沒有任何借口。我今天對你們非常失望。」

接下來,也許是覺得有必要鼓勵一下大家,老師的語氣似乎緩和了一些:「但你們也不要自暴自棄。等到了十幾歲,你們會發現,周圍的女生自然就變笨了。她們後勁不足,成績會不斷下降。即便如此,我還是希望你們都能更加努力,發揮你們作為男生的潛力。落在女生後面是不可接受的,大家明白了嗎?」

因為小學老師的「女生長大就變笨」的言論,對她形成了刺激,在後來學習物理受挫時,就想到此 —— 「女生就是不如男生嗎?難道這就是等待每個女孩智力發展的殘酷命運嗎?最糟糕的是(甚至比我的課堂表現還要糟糕),我找不到答案。」

在小學的最後一個暑假,李飛飛被父母告知,他們需要先後移民至美國。此刻的她還不知道這意味著什麽。短短幾周後,家中就只剩下李飛飛和母親兩人。和父親的這一別,便是三年。

在此期間,李飛飛對父親的思念從未改變,記憶中的父親 曾在一家化學公司的計算部門工作,他對嚴肅性有一種病態的過敏,天生就能從光、速度、扭矩、力、重量和張力的角度來看待世界,在家裏透過物理學知識解決各種難題。這份思念促使著她去了解父親熱愛的物理學,她也開始逐漸了解物理學的美麗和偉大。隨著物理成績的進步,一項新技能似乎正源源不斷地從她身上湧出——她意識到,這就是自己第一次愛上的事物,持續時間可能是一生。

15 歲那年,李飛飛懷揣著復雜的心情,跟著母親來到上海的浦東機場。在外灘,她想到了愛因史坦也曾是個移民,這帶給了她一絲樂觀的情緒。

目的地,美國。她的身邊除了母親,唯有物理學。

尋找北極星

李飛飛和父親時隔三年的重逢既沒有感人淚下的情節,也沒有發生突如其來的轉折。他的父親因二手車拋錨姍姍來遲,母女兩人在機場出口徘徊了數小時。這段經歷還讓李飛飛發現,自己學了幾年的基礎英語,在實際生活中似乎毫無用處。

對那個年代的移民家庭來說,這一切只是家常便飯。

在名為帕西帕尼的小鎮,她們開始了新生活:李飛飛不僅需要從頭學習自己無比熟悉的數理術語的英文說法,甚至還要學起日常交際英語。這種語言不通的問題困擾著整個家庭,因此她們一家三人都需要從底層打工開始做起:不穩定的兼職、貧乏和勞動的迴圈、高速發展的機器學習技術( 此時的 CNN 之父楊立昆,才剛起步自己的研究人生 )……一切都比她離開的世界「更明亮、更快、更沈重、更喧鬧」。

除了有些累的新生活,母親惡化的病情也令李飛飛十分擔憂。在某一日的家庭出遊中,父親將車開到了普林斯頓大學的校園,一尊青銅半身像引起了她的註意——那正是愛因史坦的紀念雕像。

看著這尊雕像,她意識到,自己對物理學的熱情只是被新環境嚇到了,並沒有消退。很快,她重新找到了自己追逐的目標。

學年第一次的數學考試,李飛飛離拿 A 只有 0.6 分之遙。這場失利除了讓她十分沮喪,還讓她鼓起勇氣,開始頻繁拜訪數學老師的辦公室請教問題。

她的高中數學老師鮑伯·薩貝拉(Bob Sabella)擁有獨立的辦公室和首席教師的頭銜。薩貝拉為李飛飛的新生活帶來了很大的幫助,由於帕西帕尼高中沒有微積分課,所以薩貝拉為李飛飛專門設計了一個臨時的課程,在午休期間教導她。薩貝拉不僅會在交流中指出她的用詞錯誤並不厭其煩地解釋單詞和英語概念,還和她交流在文學上的興趣:薩貝拉向李飛飛推薦科幻書籍,而她又給薩貝拉推薦中國的「四大名著」。

兩人逐漸熟絡,李飛飛的父母親切地稱呼薩貝拉為「大胡子數學老師」,而薩貝拉和他的妻子瓊也將李飛飛視如己出,帶她去迪斯尼度假。

高三畢業後,李飛飛懷揣著對愛因史坦的憧憬,考進了普林斯頓大學。準確地說,李飛飛不僅進入了普林斯頓大學的提前錄取周期,還獲得了全額的經濟援助獎學金。這一結果同樣驚呆了栽培她的薩貝拉老師。

步入大學後,李飛飛開始逐漸遊走於「現實」和「校園」兩個世界。在「現實」中,她需要照顧母親加重的病情和家庭的經濟情況;而在「校園」裏,她接觸到了無數的少年天才們,以至於她在書中將普林斯頓大學形容為「智力天堂」。她依舊緊密保持著和薩貝拉夫婦的聯系,他們是她在美國為數不多的朋友,且在李飛飛認識的成年人當中,只有這對夫婦真正經歷過大學生活,可以給予她「過來人的經驗」。

好景不長,大一還未結束,兩個世界如同脫軌的列車互相碰撞。原來,李飛飛的母親在十幾歲時就患有風濕熱,病情不斷地加重,並開始威脅生命。此時,依然是薩貝拉夫婦站了出來,為李飛飛的母親找到了面向低收入家庭的手術機構。針對李飛飛家庭加劇的經濟危機,薩貝拉夫婦借給她 2 萬美元開了一家幹洗店,讓她的父母經營。李飛飛在過往和這對夫婦無話不談,甚至常和薩貝拉老師就一些無關緊要的問題唇槍舌劍一番。但收到這筆錢,卻令她無話可說。

從此,她幾乎每個周末都要回家幫忙經營父母的幹洗店。令人振奮的是,李飛飛的父母也在正式經營幹洗店之後, 也因生活步上正軌 逐漸找回了自信。

大二那年的夏天,李飛飛被柏克萊大學的神經科學實驗選中 作為 助理,得以前往加州,第一次見識真正的前沿科學世界。實驗的內容是:如果給一只貓播放一連串視覺刺激影像,我們是否能夠利用貓大腦中檢測到訊號來重建這些片段?

在黑暗的實驗室中,是那令人終生難忘的景象:擴音器混亂的雜訊,節奏的聲音變化,每個看似統一的神經元群顯示出獨特的音調,以及透過這些訊號所重建的、貓腦海中的景象。 這份經歷成為了李飛飛人生的轉折點,她意識到物理學的魅力不僅是方程式式,還有對其象征意義的追逐和探索 。她在書中忘我地回憶這場實驗的每一起細節,仿佛靈魂的一部份永遠留在了柏克萊的實驗室,從未離去。

李飛飛的父母移民美國闖蕩,她將父母對無限機會的追求比喻為「北極星」。「北極星」是歷史上每一位科學家窮盡一切追逐的座標,而找到屬於自己「北極星」的人,會在余生煥發出無與倫比的活力。物理學教給了李飛飛一件事,那就是對提出重大問題和尋求「北極星」的熱情。

初次亮相

在李飛飛畢業的那年,互聯網泡沫爆發了。

正值互聯網行業蓬勃發展之際,就連華爾街也瘋狂找人,想趕上這一風口。李飛飛一下收到了多家頂級投行丟擲的橄欖枝,但母親只用了兩個問題,讓她重新審視自己的內心追求。

「媽媽,我面試了幾家公司,就是一些華爾街巨頭,他們給的條件很誘人……」

「華爾街巨頭?」

「就是股票、交易什麽的。搞投資的。會有很多東西需要學習,但如果我下決心,肯定能學會的……」

「這是你想要的嗎?」

「我的意思是,光是薪水就足以改變我們的生活了,而且——」

「飛飛,這是你想要的嗎?」

「…你知道我想要什麽,媽媽。我想成為一名科學家。」

「那還有什麽好說的呢?」

2001 年,李飛飛赴加州理工學院深造,在電腦視覺領域的兩位傑出導師彼得羅·佩羅納(Pietro Perona)教授和凱瑞斯托夫·科赫(Christof Koch)教授的指導下,專註於神經科學與電腦科學交叉學科的研究。彼得羅和凱瑞斯托夫都是具有冒險精神的學者,癡迷於最前沿的電腦視覺研究。這種情緒帶動著李飛飛,他們鼓勵她廣泛閱讀文獻,緊跟領域的最新發展。

在彼得羅的辦公室外,她還邂逅了自己未來的伴侶:西爾維奧·薩瓦雷斯(Silvio Savarese)。她對西爾維奧的最初印象是「充滿好奇心的呆子」——就像她自己一樣。

博士學業完成後,李飛飛前往伊利諾大學香檳分校和普林斯頓大學擔任助理教授,正式開始自己的學術生涯。

當時,人工智慧尚未受到廣泛關註,而她選擇的電腦影像辨識更是鮮有人涉足的冷門方向。即使面臨資金申請困難、外界質疑以及性別與種族偏見等多重挑戰,李飛飛仍懷揣著熱情堅持投入研究,自掏腰包補貼計畫。

研究之初,李飛飛面臨的不僅僅是技術上的挑戰,還深受性別偏見的影響。有些教授甚至嘲諷她,不如做點有用的事。尤其是在研究界,有一種長期的偏見:他們認為,李飛飛作為亞裔女性,啃電腦影像辨識這塊硬骨頭,根本不可能做出成績。

在經歷了艱難的研究初期和幾乎停滯不前的進展後,李飛飛結識了自己在普林斯頓大學的校友 & 同事、計算語言學教授克里斯汀·菲爾鮑姆(Christiane Fellbaum)。這次談話中, 克里斯汀向李飛飛提出了一個將改變後者命運的問題:

你聽說過一個叫 WordNet 的計畫嗎?

WordNet 是一個由普林斯頓大學認識科學實驗室建立和維護的詞典計畫。這個計畫的目標可謂是野心勃勃: 將人類透過語言表達的每一個概念都組織到一個龐大的單詞資料庫。 這個計畫還有一個衍生的計畫 ImageNet ,即用視覺範例闡釋 WordNet 包含的每一個概念。克里斯汀正是 WordNet 計畫的聯合開發者。

李飛飛心動了。WordNet 的計畫概念讓她發現, 正如嬰幼兒透過觀察無數物體和場景來學習辨識一樣,電腦或許也能透過分析大量圖片及其關聯性進行學習。於是,她向克里斯汀討來了「ImageNet」這個「失敗作」的名字,打算讓這個名字承載自己的想法。

在構建包含數百萬張圖片的數據集過程中,李飛飛遭遇了巨大工程難題。幸運的是,她得到了李凱教授及學生鄧嘉的支持,借助他們的分布式計算專長解決了數據下載和標註的問題。從手動搜尋下載到編寫爬蟲自動抓取 Google 上的圖片,再到利用 Amazon Mechanical Turk 眾包平台進行全球範圍內的標註工作,歷經兩年艱辛努力,終於建立起擁有近 1500 萬張圖片的 ImageNet 資料庫。

期間,李飛飛的「師爺」、彼得羅教授的導師吉滕德拉(Jeetendra)教授找到她詢問近況。她有問必答,結果卻被吉滕德拉潑了一身冷水:「你們在這個想法投入太多了……科學的訣竅是跟隨著你的領域一起成長。不要太超前 」在此之前,李飛飛還想過找吉滕德拉做自己的推薦人。

2009 年,他們將論文 ImageNet: A Large-Scale Hierarchical Image Database 投向了電腦視覺的頂會之一:CVPR(Conference on Computer Vision and Pattern Recognition)。令人大跌眼鏡的是,CVPR 的主辦方直接拒絕讓她上台演講,只允許展出一張小海報。

北極星開始閃爍,逐漸暗淡,幾近失去光芒。

照亮人類道路的星

ImageNet 釋出的第二年,為了檢驗其潛力,李飛飛的團隊決定將 ImageNet 引入第二年在歐洲舉行的電腦視覺大賽中,提議參賽者使用該資料庫來訓練他們的演算法,從而催生了 ImageNet 大規模視覺辨識挑戰賽(ILSVRC)

李飛飛的人生與事業也迎來了新的階段,她在同年受聘於史丹佛大學擔任助理教授職位。彼時,她已婚嫁給了西爾維奧,但因其工作關系身處密西根大學,兩人面臨地理上的長期分離問題。

現實不是小說。最初的 ILSVRC 比賽在李飛飛被視為 ImageNet 歷史上「最令人泄氣」的時刻之一,沒有多少創新的發明在比賽中誕生。

就這樣,轉眼來到 2012 年的第三屆 ILSVRC,Alex Krizhevsky、Ilya Sutskever 和 Geoffrey Hinton 三位學者運用基於神經網路的 AlexNet 模型,在 ImageNet 上取得了顯著成果,錯誤率降至 15.3%,遠遠領先於其他參賽者。這次突破打破了人們對神經網路的傳統認知,也讓 ImageNet 名聲大噪。

當時的李飛飛正處於產假,並突然接到了薩貝拉教授逝世的噩耗,故而未能親臨義大利佛羅倫斯的頒獎現場。但她敏銳地感知到這將是人工智慧發展史上的一個重大時刻,於是在一個晚上果斷購機票連夜飛往義大利觀禮。

2012 年,33 歲的李飛飛被史丹佛大學授予終身教職榮譽,成為該系有史以來最為年輕的終身教授。

Hinton 基於 ImageNet 所研發的深度神經網路確實顛覆了整個領域,它標誌著電腦視覺技術的重大飛躍。截至 2017 年的比賽,電腦辨識影像中物體的錯誤率已從 2012 年的 15% 驟降至不足 3%——此刻,電腦的視覺能力已經超越了人類水平。

隨著 ImageNet 的成功,李飛飛的名字與人工智慧領域的革新緊密相連,她的工作為後來的研究者提供了堅實的基礎,激勵著無數科技人才投身於人工智慧尤其是電腦視覺的研究。而她本人在面對性別歧視、種族偏見以及學術困境時展現出的堅韌不拔和智慧勇氣,也成為了女性科學家在科研道路上克服困難、追求卓越的典範。

如今電腦視覺領域有 Sora 橫空出世,大模型依然混戰不斷,AGI 的未來充滿著不確定性。這裏以李飛飛自傳的最後一段結尾,祝每一位迷茫的開發者、每一位努力奮鬥的女性都能找到屬於自己的「 北極星 」:

在現實世界中,存在著一顆北極星,那是小熊星座中最明亮的恒星。而在思想的世界裏,卻存在無數個類似的導航指引。每一種新的追求,每一個新的癡迷,都懸掛在黑暗的地平線上,閃爍著耀眼的光芒,向不懈追尋的人們招手致意。這就是為什麽我最大的快樂在於知道旅程永遠不會結束,我也永遠不會停歇。總會有新的事物等著我去追逐探索。對科學家而言,想象力就如同布滿北極星的璀璨天空。

4 月 25 ~ 26 日,由 CSDN 和高端 IT 咨詢和教育平台 Boolan 聯合主辦的「 全球機器學習技術大會 」將在上海環球港凱悅酒店舉行,特邀近 50 位技術領袖和行業套用專家,與 1000+ 來自電商、金融、汽車、智慧制造、通訊、工業互聯網、醫療、教育等眾多行業的精英參會聽眾,共同探討人工智慧領域的前沿發展和行業最佳實踐。 歡迎所有開發者朋友存取官網 http://ml-summit.org、點選「閱讀原文」或掃描下方海報中的二維碼 ,進一步了解詳情。