當前位置: 妍妍網 > 碼農

為什麽ChatGPT等AI大模型都是基於Python開發?

2024-03-21碼農

知乎上有個問題比較火,國內主流AI大模型都是Python 開發的,國外AI大模型是什麽語言開發的?為什麽要用python?

有個很簡單的方法可以看開源的AI工具主要用哪種程式語言,你只需要去Github看這個AI計畫倉庫基礎資訊,它會標出來主要基於哪種語言開發的。

Github會綜合分析倉庫中副檔名、程式碼、主要內容等來自動確定主要是哪種程式語言。

開啟Openai在Github的帳號,有將近200個計畫倉庫,你會發現幾乎90%的倉庫都是主要基於Python開發的,盡管也會有其他語言程式碼,但Python貢獻了多數程式碼。

下面舉幾個例子:

gpt2: 無監督多工學習語言模型論文的程式碼

DALL-E: Open AI的影像生成產品,類似midjourney

whisper: Openai的語音辨識轉換產品

其他還有很多倉庫都是以Python語言為主

不只是OpenAI,其實大多數知名AI公司產品都是主要基於Python,比如創造了Alpha狗的Deepmind,你去翻看它的Github倉庫,也是同樣情況

到底為什麽AI產品都主要基於Python進行開發?

我們知道AI主要是基於機器學習、深度學習、神經網路等技術,因此對計算、演算法要求很高,需要專業的AI庫來支持開發,比如谷歌的Tensorflow、Facebook的Pytorch和Caffe、百度的PaddlePaddle等等,還有像numpy、scipy等底層計算庫,是AI訓練不可或缺的工具。

這些用來跑AI演算法的庫都是在Python生態中構建的,雖然底層程式碼會有C、C++等語言,但封裝、使用、介面、維護等主要依靠Python來實作,所以你會發現幾乎所有AI產品都是主要基於Python開發。

如果說數據和算力是AI的彈藥,那麽python及其所擁有的第三方庫生態則為AI提供了發射彈藥的火箭筒。

這是表面上的原因,而深層次的原因是python足夠簡單易用,具有膠水內容,且跨平台通用性好,為融合Ai工具提供了底層能力,也讓演算法工程師們花最少的程式碼時間創造出最大的價值,這是其他語言所沒法比擬的。

加入知識星球【我們談論數據科學】

600+小夥伴一起學習!