縮小數字鴻溝,需要更多DeepSeek
OpenAI2月6日宣布向所有用戶開放ChatGPT搜索功能,無需注冊。不少分析認為,這是受到深度求索(DeepSeek)開源的壓力。的確,DeepSeek將相關模型置于開源社區向全球開放的做法,不僅給技術生態和人工智能大模型發展生態帶來全新沖擊,而且正在以一種鯰魚效應推動人工智能領域的領先企業走向良性競爭,有效促進人工智能普惠包容發展,為全球數字化轉型注入新的動能。
性能與成本優勢,成為DeepSeek大模型最受關注的焦點。自發布以來,全球AI業界均承認該大模型在技術架構、訓練算法及硬件資源利用方面實現了顯著突破,也具有明顯的訓練以及部署成本優勢。這實際上給出了一個至關重要的信息:在人工智能發展突飛猛進,日趨成為國家競爭焦點的當下,人們高度關注人工智能的普惠以及包容發展;更直白地說,就是希望人工智能的發展,能夠讓經濟上處于相對弱勢的國家與非國家行為體,也能夠享受人工智能帶來的優勢。
雖然英偉達CEO黃仁勛提出了“主權人工智能”的概念,但是在DeepSeek問世之前,人們看到的,更多是類似美國推出的“星際之門”項目,不僅初期投入動輒達到千億美元的量級,它的運維成本、供應鏈安全、可持續部署成本等均顯著超出大多數“全球南方”國家可以承擔的水平。聯合國在《全球數字契約》中提出了包容發展、數據主權、技術透明與責任治理等一系列原則,倡導建立公平、普惠、包容的全球數字生態。然而,在DeepSeek問世之前,如何在人工智能大模型發展的實踐中踐行這些原則,仍然是一個極具挑戰性的難題。特別是如何避免人工智能被個別發達國家及其核心盟友壟斷,如何保障算力芯片等關鍵元器件的供應鏈安全,都是亟待解決的問題。
在此背景下,就能夠意識到DeepSeek作出的更大貢獻:通過采用高效分布式訓練策略、梯度累積技術以及動態調整學習率機制,使得訓練過程中的能耗和部署成本大幅降低,降到了“全球南方”國家可以承受的程度。可以說,DeepSeek的推出有效回擊了2023年OpenAI的CEO奧爾特曼訪問印度時的表態。他當時對印度團隊想用1000萬美元進行基礎模型訓練表示懷疑:“與我們(指OpenAI)競爭完全沒有希望”。
DeepSeek大模型發布后不久,百度智能云、華為云、阿里云、騰訊云、360數字安全、云軸科技等多個平臺宣布上線DeepSeek大模型;在全球范圍,微軟Azure、亞馬遜AWS、英偉達等,均以嵌入服務等方式,實現了對DeepSeek開源模型的支撐。作為一個純市場化運營的科研團隊提供的DeepSeek開源模型,已經迅速為全球人工智能治理的良性變革注入了巨大的動能,為推動國際社會共同構建普惠包容的數字未來提供了重要的實踐支撐。
當然,整個過程不會是一帆風順的。無論是針對DeepSeek的網絡攻擊,又或者是來自一些國家政治上抹黑、技術上貶低、使用上限制,甚至直接打壓等,都說明個別國家的某些行為體,在謀求人工智能霸權、炒作相關議題等方面,投入了近似“輸不起”的沉沒成本。“一旦有適當的利潤,資本就膽大起來。……為了100%的利潤,它就敢踐踏一切法律;有300%的利潤,它就敢犯任何罪行,甚至不惜冒絞首的危險。”(《資本論》腳注)這樣的判斷,同樣適用于對未來全球人工智能治理領域發展的研判與展望。
因此,可以想見的是,全球需要負責任的國家充當強有力的引領者,能夠為人工智能的良性發展提供有效支撐。從實踐看,中國在共建“一帶一路”倡議框架下倡導的“數字絲綢之路”,與DeepSeek的開源大模型之間,存在某種天然的契合點。DeepSeek的開源大模型,具有可以被精細化定制的公共產品的屬性;“數字絲綢之路”倡導的原則,無論是對互聯互通、共商共建共享的倡導與實踐,還是對普惠包容發展的尊崇,從治理規范和原則上都提供了堅實的保障。中國相關企業的技術能力,從大模型到算力芯片,再到相應的云服務,以及支撐的數字底座,可以提供更具安全感和可信度的供應鏈產業鏈保障。
有理由相信,在各方共同努力下,DeepSeek已經開源的大模型,有助于推進以更快的速度,實現聯合國《全球數字契約》中人人享受數字紅利的美好愿望,為縮小全球數字鴻溝、在數字革命的背景下實現社會公平,注入強大的動力與確定性。全球各主要行為體應以此為契機,加強務實合作、推動政策創新,共同打造一個更加美好的數字未來。(作者是復旦大學網絡空間國際治理研究基地主任)