知乎上有個問題比較火,國內主流AI大模型都是Python 開發的,國外AI大模型是什麽語言開發的?為什麽要用python?
有個很簡單的方法可以看開源的AI工具主要用哪種程式語言,你只需要去Github看這個AI計畫倉庫基礎資訊,它會標出來主要基於哪種語言開發的。
Github會綜合分析倉庫中副檔名、程式碼、主要內容等來自動確定主要是哪種程式語言。
開啟Openai在Github的帳號,有將近200個計畫倉庫,你會發現幾乎90%的倉庫都是主要基於Python開發的,盡管也會有其他語言程式碼,但Python貢獻了多數程式碼。
下面舉幾個例子:
gpt2: 無監督多工學習語言模型論文的程式碼
DALL-E: Open AI的影像生成產品,類似midjourney
whisper: Openai的語音辨識轉換產品
其他還有很多倉庫都是以Python語言為主
不只是OpenAI,其實大多數知名AI公司產品都是主要基於Python,比如創造了Alpha狗的Deepmind,你去翻看它的Github倉庫,也是同樣情況
到底為什麽AI產品都主要基於Python進行開發?
我們知道AI主要是基於機器學習、深度學習、神經網路等技術,因此對計算、演算法要求很高,需要專業的AI庫來支持開發,比如谷歌的Tensorflow、Facebook的Pytorch和Caffe、百度的PaddlePaddle等等,還有像numpy、scipy等底層計算庫,是AI訓練不可或缺的工具。
這些用來跑AI演算法的庫都是在Python生態中構建的,雖然底層程式碼會有C、C++等語言,但封裝、使用、介面、維護等主要依靠Python來實作,所以你會發現幾乎所有AI產品都是主要基於Python開發。
如果說數據和算力是AI的彈藥,那麽python及其所擁有的第三方庫生態則為AI提供了發射彈藥的火箭筒。
這是表面上的原因,而深層次的原因是python足夠簡單易用,具有膠水內容,且跨平台通用性好,為融合Ai工具提供了底層能力,也讓演算法工程師們花最少的程式碼時間創造出最大的價值,這是其他語言所沒法比擬的。
加入知識星球【我們談論數據科學】
600+小夥伴一起學習!