隨著非洲網路經濟預測到 2025 年將達到1800億美元,並有可能在2050年激增至7120億美元,人工智慧預計將在其中扮演關鍵角色。人工智慧市場推測到2030年將達到165億美元。然而,語言的擴展將是這場成長是否具包容性的決策因素。在非洲這片大陸上,有超過2000種語言正在使用。如果技術不能以非洲人每天使用的語言進行交流,數位經濟將無法達到其全部潛力。

自然語言處理(NLP)是人工智慧的一個分支,它可以讓機器理解和生成人類語言。在全球範圍內,自然語言處理為語音助手、聊天機器人和翻譯系統提供動力。在非洲,自然語言處理的重要性更加突顯,因為大多數數位平台仍然是單一語言,通常默認為英語或法語。這導致了大規模的排擠效應。只有0.02%的線上內容使用非洲語言,這讓人工智慧模型無法觸及約魯巴語、斯瓦希里語、祖魯語、豪薩語、阿姆哈拉語和數百種其他語言。

聯合國教科文組織(UNESCO)已經警告,如果不進行數位化,到 2100 年,有超過 3000 種語言,其中許多是非洲語言,可能會消失。即使是使用人數達到數千萬的語言在人工智慧時代也可能被邊緣化。

這些問題具有現實中的影響。在奈及利亞,用於選民教育的公民技術工具通常不包括豪薩語、約魯巴語和伊博語。在肯亞,說斯瓦希里語的公民面臨使用默認為英語的數位平台的障礙。整個大陸的公民都無法用自己的語言獲取服務,這導致研究人員所稱的 “數位空間的語言不平等”。這不僅是一個文化問題,也是經濟問題。如果數位服務未包括當地語言,使用率將放緩,信任度將下降,社會上的大多數人將無法充分受益於網路經濟。

然而,機會是巨大的。自然語言處理可以將非洲的語言多樣性轉變為競爭優勢。在金融科技領域,能理解皮欽語、豪薩語或斯瓦希里語的聊天機器人已經在擴展銀行業的可達性。奈及利亞的金融科技公司如 Kudi.ai 使用融合英語和當地語言的對話介面來提供微型貸款和行動支付。在醫療領域,肯亞的 Uliza Llama 聊天機器人用五種非洲語言提供母婴健康建議,而在馬拉維,UlangiziAI 已經在 WhatsApp 上用契切瓦語回答了數千名農民的問題,將響應時間從數天縮短到數秒。教育正在由使用母語工作的人工智慧輔助教學工具和閱讀助手重新塑造,提高了讀寫和理解能力。政府也開始作出反應:南非和肯亞的公民平台正在以多語種聊天機器人進行實驗,讓公民能夠用伊西祖魯語、斯瓦希里語和其他當地語言參與服務。

幾個創新專案突出了這股潮流。奈及利亞開發的 YorubaGPT 是一款用約魯巴文本訓練的聊天機器人,既保留了成語、諺語和文化細微差別,還為超過 5000 萬約魯巴語使用者提供服務。Masakhane 專案是一個泛非研究社群,正在為數十個非洲語言對構建機器翻譯模型,展示合作的力量。2024 年,南非的 Lelapa AI 推出了 InkúbaLM,這是該大陸的首個多語種大型語言模型,支持斯瓦希里語、約魯巴語、豪薩語、伊西克薩語和伊西祖魯語。全球企業也開始注意。Google 近期在翻譯、Gboard 和語音識別中新增了超過 30 種非洲語言,讓 3 億以上的非洲人使用語音與網路互動。

然而,障礙依然顯著。數據匱乏是最大問題。大多數非洲語言缺乏用於訓練人工智慧模型的大量、乾淨的數據集。許多語言主要是口語,沒有標準化的書寫系統,或者音調上有複雜性,這對傳統模型構成挑戰。基礎設施是另一個關鍵限制。訓練先進自然語言處理模型需要 GPU,更可靠的電力和高速網際網路,這些資源在非洲大部分地區仍然稀缺。技能同樣短缺。非洲現在大約有 70 萬名軟體開發人員,但僅一小部分受過人工智慧和自然語言處理的培訓,其中很多也因人才流失而離開。資金仍然傾斜於金融科技和物流初創公司,使語言技術資源不足,儘管其長期重要性不言而喻。而政策框架仍需跟上。很少有政府要求提供多語種數位服務,或投資於國家語言數據集,儘管肯亞和南非已開始在國家策略中整合人工智慧。

儘管面臨這些挑戰,前進的道路很清晰。政府應該要求公共數位服務以本土語言提供,從而立即創造自然語言處理解決方案的需求。投資者應意識到,將有 5 億非洲人將主要以當地語言上網,因此自然語言處理是進入全新市場的門戶。大學和社群必須擴大培訓、建立數據集,並支持像 Masakhane 這樣的開源專案。科技公司必須承諾以非洲語言建立服務,否則將面臨被其他平台取代的風險。

願景令人振奮。想像一下,塞內加爾的農民在播種前用沃洛福語諮詢人工智慧顧問,德班的青少年用祖魯語系統學習編程,卡諾的患者向豪薩語聊天機器人描述症狀,拉各斯的議會使用人工智慧即时在約魯巴語、豪薩語、伊博語和英語間進行翻譯。這些情境都在觸手可及之內。共同展示了一個技術適應人群而非人群適應技術的大陸。

非洲的語言多樣性曾被視為障礙,但在人工智慧時代卻可以成為其最大優勢。藉由接納自然語言處理,非洲不僅可以解鎖其數位經濟,還可以為全球包容性技術設立標準。1800億的數字不僅僅是經濟目標,還代表著數以百萬計的人加入到數位化發展的浪潮中。保存數位化的非洲語言不只是關乎於文化遺產,而是確保未來沒有人會被排除在機會之外。這片大陸有機會引領世界,展示當人工智慧可以講每個人的語言時,技術變得更加人本、包容和公正。