当前位置: 欣欣网 > 码农

为什么ChatGPT等AI大模型都是基于Python开发?

2024-03-21码农

知乎上有个问题比较火,国内主流AI大模型都是Python 开发的,国外AI大模型是什么语言开发的?为什么要用python?

有个很简单的方法可以看开源的AI工具主要用哪种编程语言,你只需要去Github看这个AI项目仓库基础信息,它会标出来主要基于哪种语言开发的。

Github会综合分析仓库中文件扩展名、代码、主要内容等来自动确定主要是哪种编程语言。

打开Openai在Github的账号,有将近200个项目仓库,你会发现几乎90%的仓库都是主要基于Python开发的,尽管也会有其他语言代码,但Python贡献了多数代码。

下面举几个例子:

gpt2: 无监督多任务学习语言模型论文的代码

DALL-E: Open AI的图像生成产品,类似midjourney

whisper: Openai的语音识别转换产品

其他还有很多仓库都是以Python语言为主

不只是OpenAI,其实大多数知名AI公司产品都是主要基于Python,比如创造了阿尔法狗的Deepmind,你去翻看它的Github仓库,也是同样情况

到底为什么AI产品都主要基于Python进行开发?

我们知道AI主要是基于机器学习、深度学习、神经网络等技术,因此对计算、算法要求很高,需要专业的AI库来支持开发,比如谷歌的Tensorflow、Facebook的Pytorch和Caffe、百度的PaddlePaddle等等,还有像numpy、scipy等底层计算库,是AI训练不可或缺的工具。

这些用来跑AI算法的库都是在Python生态中构建的,虽然底层代码会有C、C++等语言,但封装、使用、接口、维护等主要依靠Python来实现,所以你会发现几乎所有AI产品都是主要基于Python开发。

如果说数据和算力是AI的弹药,那么python及其所拥有的第三方库生态则为AI提供了发射弹药的火箭筒。

这是表面上的原因,而深层次的原因是python足够简单易用,具有胶水属性,且跨平台通用性好,为融合Ai工具提供了底层能力,也让算法工程师们花最少的代码时间创造出最大的价值,这是其他语言所没法比拟的。

加入知识星球【我们谈论数据科学】

600+小伙伴一起学习!