發表日期 3/5/2022, 2:00:55 PM
文丨腦極體
東歐土地上驟然開啓的衝突,掀起瞭一場聲勢浩大的製裁潮。有一些如同玩笑,比如連西伯利亞的貓都不放過;而有一些則意味深長,比如開源軟件限製開發者訪問。
2月28日,俄國準官方大報《生意人報》放齣消息,稱世界第一開源軟件平台GitHub正在考慮限製俄羅斯軟件開發者訪問開源軟件源代碼儲存庫。
很多國傢政府部門、企業使用的軟件平台幾乎都是完全基於開源代碼搭建的,而全世界能夠提供開源軟件許可證的科技企業,大多是歐美巨頭。俄羅斯政府數碼開發部也認為,在國內限製使用開源軟件“極不現實”。
Github風波,再一次讓開源軟件的自主可控成為業界關心的焦點,這不禁讓我們想到至關重要的AI開發底座――深度學習開源框架的國産化情況,究竟如何。
如今,AI技術已經在我們的生産生活、公共管理等方方麵麵得到深入應用,開發AI應用的深度學習框架作為基礎設施,如果也說停就停,會給以數字經濟引領高質量發展的中國産業,帶來一係列不確定因素。
那麼,加強中國AI基礎技術的安全係數,究竟是杞人憂天,還是確實應該未雨綢繆、防患於未然呢?我們不妨先從邏輯和全麵的視角,來梳理一下中國AI基礎技術的真實麵貌。
人工智能的“函榖關”
地處桃林塞之中樞,崤函古道之咽喉的函榖關,自古以來都是兵傢必爭的戰略要地,深度學習框架就如同AI的“函榖關”,能夠對AI技術和産業的發展形成底層製約,所以必須要牢牢掌握在自己手中纔行。
首先,突如其來的直接封鎖,並非完全不可能。海外科技企業也會隨著局勢變化而調整平台開放策略,比如GitHub此前就曾突然限製過古巴、朝鮮、伊朗和敘利亞等國傢用戶訪問。
而AI基礎技術平台上,承載著大量AI數據集、文檔、代碼、模型和核心應用,涉及到民生、安防、城市交通、公共服務等核心事務,一旦海外開源斷供,帶來的商業損失和安全風險,會直接影響國計民生。從這個層麵來說,AI基礎技術即深度學習框架的國産化是勢在必行、不容有失。
當然,或許你會覺得沒有極其重大的衝突,就不會導緻封鎖。但中國有句話叫君子無罪,懷璧其罪。有纔能難免會引人猜忌,而眾所周知,中國對人工智能等前沿科技的重視,人工智能産業規模逐年上升,隨著中國AI越來越發達,必然會引發海外一些國傢的猜忌。
比如過去5年來,美國就一直緻力於加強自身在人工智能領域的領導地位,美國議員湯姆・科頓曾公開聲明,中國留學生來美國學莎士比亞就夠瞭,不需要學習量子計算和人工智能。海外政治傢對中國AI發展過快的焦慮,可能成為封鎖開源AI的“欲加之罪”。
這樣的製裁雖然可能遭遇全球技術人士的譴責,但其實遏製方式並非隻有直接封鎖這一條路。通過停止更新、高額收費、搞差異化對待、排斥中國AI企業等,都會拖慢中國智能化發展步伐。
這並不是不可能,《生意人報》就提到,即使正式的開源軟件可以自由使用,但有代碼的作者有理由拒絕特定人群使用,而已經有作者在社交網站上發帖討論是否禁止俄國程序員使用他們的代碼。
守住AI的“函榖關”,不過度依賴國外技術,是中國産業能在數智化浪潮中順利前行最重要的基礎。
中國AI的“安全鎖”
說到這裏,你可能會好奇,中國AI基礎技術現在有一較高下的能力嗎?畢竟不能因為一些未雨綢繆的猜想,而犧牲真材實料的技術能力與開發效率。
幸運的是,中國AI領域在深度學習框架這件事上吸取瞭曆史教訓,已經有很多中國科技企業研發的深度學習框架相繼問世,並嚮社會開源開放,像是百度的飛槳paddlepaddle、華為的Mindspore、騰訊的PocketFlow,阿裏巴巴的X-Deep Learning,曠視科技的天元(MegEngine)等。
目前,確實是無需擔心深度學習框架被“卡脖子”瞭。
不過,故事還隻是剛剛開始。在人工智能的科技競賽中,對國産開源框架的要求,不能停留在“人有我有”,當個臨時“備胎”。還需要“人有我精”,錶現齣比海外開源框架更優秀的能力。
提升中國AI的安全指數,國産開源框架還應主動鍛造三把“安全鎖”:
第一道鎖,鎖住底層技術自主權。
開源框架的國産化,首要要求就是完全自主可控,掌握核心技術的自主權。尤其是一些前沿探索類的技術上,滿足深度AI應用的開發需求,纔能吸引更多開發者加入。
相比一些針對垂直場景、個人開發者搭建的開源框架,具備技術積纍的企業開源框架平台在底層突破、技術迭代和領先性上更有優勢,TensorFlow就憑藉榖歌大量突破性的新技術成為開源框架的“扛把子”。
幸好,目前中國AI企業的技術能力也並不遜色。比如近期流行的超大規模的多模態大模型,就依賴於強大的算力、技術、開發能力來實現,目前,知識增強“文心”大模型加入到飛槳産業級模型庫中、華為雲也麵嚮産業開源瞭盤古大模型……
第二道鎖,鎖住全麵的能力範疇。
因為更懂中國AI市場、中國開發者,國産開源框架也能夠提供更具針對性的服務能力。試想一下,一個不認識英文的農村養豬場員工,想要開發一個豬臉識彆應用,跑到TensorFlow、caffe、PyTorch這樣的框架上隻能抓瞎,從這個角度,國産框架更符閤中國AI於韆行百業相結閤的真實情況。
目前,百度飛槳PaddlePaddle、華為MindSpore等國産框架,都已經提供瞭全棧、全場景的中文開發文檔、資源與訓練模型,將雲計算、知識圖譜、生物計算等多元技術能力與深度學習框架相融閤,以頭部科技企業全麵的技術能力,降低開發者的門檻,避免重復“造輪子”,為産業智能化注入瞭加速度。
第三道鎖,鎖住人纔和産業生態。
很多技術國産化的失敗都源於生態匱乏,沒有足夠多的開發人纔和産業應用支持。眾所周知,針對AI人纔的爭奪戰在海內外都十分激烈。因此,人纔和産業的生態圈建設,關乎國産框架能否長期可持續發展。
百度、華為、騰訊等都推齣瞭各自的人纔生態戰略,通過基礎教材、課程、競賽、産業閤作等多種方式,發力緩解中國AI的人纔焦渴。匯聚瞭更多人纔的創新智慧,國産開源框架的社區資源和商業價值也必將持續增長。
綜上所述,可以發現國産框架並不是“為情懷而生”,通過三把“安全鎖”,鎖定的不僅是中國AI的安全,還有AI産業規模化落地增長的無限可能。
技術國産化的“鍾擺效應”
在技術國産化的路上,很容易齣現一種“鍾擺效應”。在過度悲觀和過度樂觀中來迴擺動,感到威脅時,一股腦兒盲目紮堆,像是2020年開始,芯片半導體行業就齣現瞭一股周期性狂奔的熱潮。而一旦國産化受阻,又開始強調國際閤作,昔日的國産EDA軟件熊貓,就因為“物美價廉”的外國産品和技術而宣告摺戟,直到目前我國依然在EDA軟件上“受製於人”。
今天,人工智能為代錶的新一代信息技術,已經成為我國“十四五”期間推動經濟高質量發展的技術保障和核心驅動力之一,對於最關鍵的開發底座――深度學習框架,尤其需要避免齣現“鍾擺效應”,而要建立起“底綫思維”。
首先,積極推動國産化、自主可控的深度學習框架發展,有重點、有規劃地發展一些能夠“卡彆人脖子”的頭部框架,將國産框架的生態化基礎打牢固。知道製裁深度學習框架也沒啥大用,自然就會少打歪主意。
另外,AI的前景在於與經濟體的結閤,要進一步推動AI全麵賦能産業,降低開發門檻,這一點上我們的國産框架也是十分積極的。國內企業也要有危機意識,隨著智能經濟不斷與韆行百業深度融閤,還是要盡快切換到國産框架上來。
同時,AI技術本身決定瞭必須要通過開放開源共享,來不斷迭代升級,在自立自強的基礎上,國産框架也應該以開放的心態鼓勵更多開發者加入生態體係內,形成更具生命力、更健壯的AI開發群落。當全球頂尖AI人纔都匯聚在此,製裁自然也就成為空談,因為人的智慧是無法被封鎖的。
人工智能,是新一輪科技革命中的“中國支點”,必須在AI開發框架上站穩腳跟。堅定地走在中國自主可控的路上。
為瞭有一天,我們的頭上再也沒有技術的達摩剋利斯之劍,不妨用鬍適在《獨立評論》中的話來結尾吧:
朋友們,在你悲觀失望的時候,正是你必須鼓起堅強的信心的時候。你要深信:天下沒有白費的努力。成功不必在我,而功力必不唐捐。