為什麽ChatGPT等AI大模型都是基於Python開發？

2024-03-21碼農

知乎上有個問題比較火，國內主流AI大模型都是Python 開發的，國外AI大模型是什麽語言開發的？為什麽要用python？

有個很簡單的方法可以看開源的AI工具主要用哪種程式語言，你只需要去Github看這個AI計畫倉庫基礎資訊，它會標出來主要基於哪種語言開發的。

Github會綜合分析倉庫中副檔名、程式碼、主要內容等來自動確定主要是哪種程式語言。

開啟Openai在Github的帳號，有將近200個計畫倉庫，你會發現幾乎90%的倉庫都是主要基於Python開發的，盡管也會有其他語言程式碼，但Python貢獻了多數程式碼。

下面舉幾個例子：

gpt2: 無監督多工學習語言模型論文的程式碼

DALL-E: Open AI的影像生成產品，類似midjourney

whisper: Openai的語音辨識轉換產品

其他還有很多倉庫都是以Python語言為主

不只是OpenAI，其實大多數知名AI公司產品都是主要基於Python，比如創造了Alpha狗的Deepmind，你去翻看它的Github倉庫，也是同樣情況

到底為什麽AI產品都主要基於Python進行開發？

我們知道AI主要是基於機器學習、深度學習、神經網路等技術，因此對計算、演算法要求很高，需要專業的AI庫來支持開發，比如谷歌的Tensorflow、Facebook的Pytorch和Caffe、百度的PaddlePaddle等等，還有像numpy、scipy等底層計算庫，是AI訓練不可或缺的工具。

這些用來跑AI演算法的庫都是在Python生態中構建的，雖然底層程式碼會有C、C++等語言，但封裝、使用、介面、維護等主要依靠Python來實作，所以你會發現幾乎所有AI產品都是主要基於Python開發。

如果說數據和算力是AI的彈藥，那麽python及其所擁有的第三方庫生態則為AI提供了發射彈藥的火箭筒。

這是表面上的原因，而深層次的原因是python足夠簡單易用，具有膠水內容，且跨平台通用性好，為融合Ai工具提供了底層能力，也讓演算法工程師們花最少的程式碼時間創造出最大的價值，這是其他語言所沒法比擬的。

加入知識星球【我們談論數據科學】

600+小夥伴一起學習！