目前,許多非洲的AI專案主要聚焦於利用既有的大型語言模型,如OpenAI的GPT、Google的Gemini和Meta的Llama。然而,DeepSeek的出現證明AI產業並不僅僅是一成不變的發展軌跡。小型企業同樣有空間引入突破性的創意,並顛覆人們對構建強大模型所需條件的既有假設。

AI競逐的變局

一年之前,AI的競賽似乎是可以預測的。OpenAI、Google與Meta主導著這個領域,往研發愈加強大的模型砸入數十億美元。普遍的看法認為,AI的重大突破必然屬於那些擁有最深厚財力與最先進計算能力的企業。這是一個封閉的俱樂部,只有富庶的科技巨頭才有資格參加。

但就在此時,DeepSeek毅然打破了AI競賽的格局。

這家中國初創企業推出了DeepSeek-V3,一個可以媲美Meta的Llama 3.1的AI模型,但據報導僅花費5.6百萬美元進行訓練。做個比較,Meta的相似模型據稱約花費6千萬美元,且需要超過3080萬GPU小時的運算時間。OpenAI的GPT-4也被估計需要超過1億美元進行訓練。然而,DeepSeek僅以這些資源的小部分,便製造出了一個可與之競爭的模型。

更令人震驚的是DeepSeek是如何達成這項突破的。它並未使用最新、最昂貴的Nvidia H100 GPU,而是依賴較舊的H800芯片,並優化了其訓練技術以降低計算成本。結果是,DeepSeek僅用2000顆芯片便完成了模型訓練,而像OpenAI和Google這樣的產業巨頭通常需要使用16000顆或更多。

DeepSeek突破對AI現狀的挑戰

DeepSeek的效率對於整個AI產業有著深遠的影響。在過去,業界一直認為大型科技公司必然主導這個市場,因為只有最富有的公司才能負擔大規模AI模型訓練所需的龐大基礎設施。然而DeepSeek的成功質疑了這種假設。

如果一個資金有限、硬體受限的中國企業尚且能夠實現如此壯舉,那麼AI競賽或許不僅僅在於誰擁有更多的錢。金融市場當然也注意到了這一點。在DeepSeek發表其成果後,Nvidia的股價一時下跌,因為投資者擔心那些最大的客戶—即每年在AI基礎設施上花費數十億的公司,未來可能不再需要那麼多的芯片。產業界一直以為AI的發展需要無止境的運算能力,而DeepSeek證明了更聰明、更有效率的訓練方法同樣可以取得競爭性成果。

對非洲的啟示

DeepSeek意想不到的成功事實上是給非洲AI初創公司的一個警訊。長期以來,非洲在AI領域的角色主要是整合而非創新,習於使用外國模型而非自建新模型。普遍的看法是,非洲缺乏訓練基礎AI模型所需的資源,這包括有限的運算能力、資金和專業人才。

然而,DeepSeek的崛起可能會挑戰這種心態。如果一個中國初創企業,受美國芯片出口限制,可以找到創新辦法並優化其訓練技術,那麼非洲的企業為何不能?

這並不意味著非洲可以立即開始在DeepSeek的規模上訓練模型。可這的確證明,AI的競賽並未結束-它正在演進。DeepSeek的意料之外的崛起顯示創新可以來自任何地方。一年前,沒有人會預測一家中國公司會生產出能夠與OpenAI和Google抗衡的嚴肅技術。同理,當今也沒有人預期非洲會建立出具競爭力的AI模型。但是,正如DeepSeek所示,意外是可能的。