中文在人機互動上的優勢
隨著人工智慧的發展,人機互動成為了一個重要的議題。為了讓人工智慧更好地與人類進行溝通和交流,有四種主要的交流方式,包括口語交流、文字交流、視覺交流和意念交流。而在這四種方式中,中文展現了獨特的優勢。
首先,在口語交流中,中文具有簡潔明了的特點。中文句子短而精煉,可以更高效地進行口頭對話。其次,在書面語中,中文所占用的空間相對較小,資訊密度高。這意味著使用中文進行文字交流可以更加高效。最後,在未來可能出現的腦機互動階段,中文的效率還會進一步提升。
此外,人工智慧的實質是算力,語音辨識是需要進行高速運算的,而復雜程度較高、資訊密度較低的語言會增加算力的運算量。相比於其他表音文字語言,中文具有更高的資訊密度,資訊頻寬也更寬。雖然中文的資訊密度可能只比英語等語言高30%,但對於未來人工智慧算力來說,這可能意味著數百億甚至數千億美元的投資成本。就像中國自主研發的C919飛機燃油消耗比波音和空客低30%,這使得C919在市場上非常有競爭力。
中文在人工智慧訓練上的優勢
人工智慧的智慧程度取決於其接觸的資料資訊量和設定的條件參數。而中文資訊的高密度使得人工智慧訓練更加高效。同樣的訓練時間和數據量下,中文訓練獲得的資訊量要比英文多很多。這是因為外文作品在轉譯成中文時常常縮減了很多字數。OpenAI的ChatGPT從1.0到4.0花費了好幾年的時間,而據稱不到一年的時間,百度的文心一言和訊飛的星火就已經接近了ChatGPT4.0的水平。這可能證明了用中文進行大模型訓練的效率確實比英文高。如果中國想要趕超美國在人工智慧領域,就必須從中文的優勢出發,透過提高訓練效率和品質,快速提升人工智慧的智力水平。因此,建議中國的人工智慧研究團隊與語言文字專家共同研究大模型訓練。
人工智慧的電力需求與中國的優勢
人工智慧的核心是算力,而算力依賴芯片。然而,高能耗芯片對電力的需求非常大。舉個例子,輝達的H100芯片峰值功耗為700瓦,一年消耗的電量達到3740千瓦時。一個算力中心通常需要成千上萬個這樣的芯片,所需的電力就可想而知了。
目前,ChatGPT每天的耗電量已經達到50萬千瓦時,估計全球所有大模型每天的總耗電量已經超過了荷蘭的用電量。如果人工智慧得到廣泛普及,成為人類生活中不可或缺的必需品,算力將需要提升至少一萬倍以上!根據當前人工智慧的發展勢頭估計,算力中心的耗電量每年平均增長3-5倍,十年後全球算力中心的耗電量可能達到人類總耗電量的10%!如果人工智慧成為無處不在的必需品,那麽算力中心的電力需求很可能超過全球當前的總發電量!
而在電力方面,中國有著巨大的優勢。中國目前是全球電力產業的主導者,在火力發電、水力發電、太陽能發電、風能發電、核能發電等領域都擁有技術和成本優勢。中國每年的發電量占全球總發電量的31%,是美國的兩倍,超過其他前20個國家的總和。中國的電力產能每年還在快速增長。如果按照這種趨勢發展下去,預計十年後中國的發電量可能是美國的兩倍甚至兩倍以上!無論是工業還是人工智慧,都離不開充足且低成本的電力支持。在人工智慧競爭中,除了人工智慧芯片和演算法的競爭外,電力也是一個關鍵的競爭領域。誰能滿足人工智慧算力中心的電力需求,誰就能實作人工智慧的大規模商用。對於目前全球電力總發電量的潛在超越,美國可能會感到擔憂。
總之,從技術角度來看,我一直對中國人工智慧的前景持樂觀態度。然而,除了技術,中文和電力也是中國在人工智慧領域具有優勢的因素。中文的高資訊密度和電力供應鏈的優勢將使中國能夠在人工智慧領域取得有利競爭。