目前,許多非洲的人工智慧(AI)努力都集中在利用現有的大型語言模型,像OpenAI的GPT、Google的Gemini或Meta的Llama。然而,DeepSeek的出現證明了AI產業並不只會沿著單一軌跡發展。小型的AI企業同樣擁有引入突破性概念並打破傳統假設的空間。

開放AI競賽的先鋒者

在一年前,AI競賽看似已被巨頭科技公司所壟斷,例如OpenAI、Google和Meta。他們為了訓練出更強大的模型投入了數十億美元,普遍觀點認為AI的突破屬於那些擁有最深資金和最先進計算能力的公司。然而,DeepSeek的橫空出世改變了這一切。

這家中國的初創企業推出了一款名為DeepSeek-V3的AI模型,它可與Meta的Llama 3.1媲美,但報導指出訓練成本僅為560萬美元。而Meta的同類型模型據說耗費了約6000萬美元,並需要超過3080萬GPU小時。此外,OpenAI的GPT-4則估計製造成本超過1億美元。然而,DeepSeek憑藉有限的資源和創新技術,產出了可以競爭的模型。

更令人驚訝的是DeepSeek達成這一突破的方式。與使用最新、最昂貴的Nvidia H100 GPU不同,這家初創企業選擇了較老的H800晶片,同時優化訓練技術以降低計算成本。最終結果是,DeepSeek只使用了2000個晶片進行訓練,而OpenAI和Google等業界巨頭通常需要使用超過16000顆晶片。

DeepSeek的打破常規對AI產業的衝擊

DeepSeek效率的突破對於AI產業的影響遠不止於中國。多年來AI產業一直假設巨頭科技公司的主導地位是不可避免的,因為只有最富有的公司能負擔起模型訓練所需的龐大基礎設施。DeepSeek的成功則挑戰了這一假設。

如果一個資金有限且硬體受限的中國公司能做到如此,那麼AI賽道的競賽或許不僅僅是財力之爭。金融界對此也迅速作出了反應。DeepSeek宣布之後,Nvidia的股票價格一度下跌,因為投資者擔心這些大公司可能不再需要如此多的晶片支出。一直以來AI的開發似乎都需要無盡的計算能力,但DeepSeek證明了更加智能、高效的訓練方法能夠產生具有競爭力的結果。

非洲AI創業者的警世鐘

DeepSeek的成功無疑是非洲AI初創企業的一面警世鐘。長久以來,非洲在AI領域的角色似乎僅限於整合而非創新,使用海外模型而不是建立新模型。通常的觀點認為,由於計算能力、資金和專業人才的有限性,非洲無法培訓基礎AI模型。

然而,DeepSeek的崛起或許能轉變這種思維模式。若一個在受到美國晶片出口限制的中國公司都可尋找創造性解決方案並優化其訓練技術,為什麼非洲的公司不能呢?

這並不是說非洲可以立即開始訓練規模如DeepSeek的模型,但它確實證明AI競賽尚未結束,仍在不斷演變。DeepSeek的意外崛起顯示出創新可以來自各地。在一年前,少有人會預測一個中國公司能夠成為OpenAI和Google的有力替代品。同樣地,如今鮮有人預期非洲能夠構建有競爭力的AI模型。然而,如同DeepSeek所揭示的,意料之外的事情隨時可能發生。