發表日期 3/4/2022, 8:58:46 PM
本報記者 謝嵐
2022年北京鼕奧會的開幕恰逢中國傳統二十四節氣中的立春,開幕式以二十四節氣倒計時開場,以“雪花”作為核心意象串聯,壓軸節目《雪花》更是將“雪”的意象渲染得淋灕盡緻――漫天流動的風雪在滑冰運動員的腳下實時消散,數百名兒童亦如粒粒雪花晶瑩――冰雪的高潔與春天的生機相交融,中華文化的浪漫就孕育在這中間。
據鼕奧組委會介紹,《雪花》的空靈是由專項團隊開發的一套“基於人工智能技術的演齣實時特效係統”所實現的――錶演過程中,國傢體育場中架設的四台攝像機實時拍攝演員錶演的畫麵,隨後攝像機將視頻信號傳送到邊緣計算係統中進行三維信號重組與渲染,生成的藝術形象隨即呈現在現場的地麵LED大屏幕上與演員互動――整個過程隻需不到幾十毫秒的時間。渲染的實時、互動的流暢均需要強大的算力、高效的AI算法支撐。
鼕奧會開幕式總導演張藝謀早先就曾錶示:“本次開幕式的理念是用科技讓開幕式‘人少而不空,空靈而浪漫’。”無疑,鼕奧會的成功舉辦,讓AI這項新興技術的強大潛力更直觀地呈現在觀眾眼前。然而盡管AI技術的研發不斷突破創新,其在産業端的落地應用卻不像看起來那麼簡單。
AI發展迅猛,中小微企業仍受製約
長期以來,數據、算力、算法被視為AI發展的“三架馬車”,然而對於多數企業而言,這三駕馬車卻同時成瞭難以跨越的門檻,製約著AI産業的進一步發展乃至産業數字化轉型的進程。
一方麵,AI算法對研發能力的要求極高,中小微企業難以與掌握資源的大企業競爭、獲得研發所需的相應人纔、能力;另一方麵,AI模型的訓練依賴大量數據,而數據同樣往往隻掌握在大企業手中;而即便是對於同時掌握瞭研發能力和數據資源的企業來說,模型復雜程度攀升及數據量急劇增加所帶來的對算力要求的提升,亦進一步推升瞭算力的成本。這些都使AI技術難以有效應用落地――於大多數企業而言,AI所描繪的旖旎遠景仍似蜃樓難以觸及。
與此同時,對於整個産業來說,AI迅猛發展的同時,AI人纔需求亦呈現齣瞭巨大的缺口。高盛所發布的《全球人工智能産業布局》數據顯示,在2017年全球的新興人工智能項目之中,我國人工智能項目占比高達51%,而在同年全球人工智能人纔儲備方麵,我國的人工智能人纔卻僅占5%。報告預測,到2030年,我國人工智能人纔缺口將超過500萬人。隨著雙減政策下職業教育成為教育發展的新選擇,如何攜手高職專院校培養專業技術/技能人纔,反哺産業人纔缺口,成為當前AI産業發展及職業教育發展的一條全新探索路徑。
據此,特斯聯人工智能開放創新中心應運誕生。
2022年,首個特斯聯人工智能開放創新中心(下稱:科創中心)正式於德陽AIPARK落地運營。德陽AIPARK是特斯聯繼重慶AIPARK之後打造的又一座集聚未來城市體驗及城市科技的研發基地,其中位於園區三層的科創中心則成瞭這座新落成的園區的關鍵亮點。
特斯聯德陽AIPARK效果圖
以算法、數據、算力賦能中小微企業AI發展
科創中心是特斯聯所打造的人工智能計算中心(AICC),同時兼備著算法孵化、科研共享及人纔培養的使命。據特斯聯介紹,這是公司以創新研發反哺産業生態,助力産業發展的第一步。
據特斯聯相關技術負責人介紹,科創中心的設立旨在充分貫通學術生態和産業生態,使學術生態得以基於産業數據研發相應的預訓練模型,並以“成本共擔”的方式,為AIPARK周邊的中小微企業提供AI所需的算力、數據、算法模型等核心要素,讓各體量、具備不同AI基礎的企業均能通過學術機構所研發齣的模型,以低代碼、模塊化的生産方式依據自身的需求,實現自有知識産權算法的孵化及既有成熟算法的調用,進而推動更高效的AI産業實踐。
特斯聯人工智能開放創新中心實景圖
作為特斯聯核心AI能力落地的載體,科創中心具備算力、數據、模型三大核心能力的輸齣:
算力方麵,特斯聯以科創中心為單位麵嚮中小微企業提供算力,不同的科創中心其規模、設施亦不盡相同。德陽科創中心占地約240平方米,一期規劃算力達全精度31P、雙精度2P、單精度125P、半精度65P。而尤其值得注意的是,未來科創中心的算力並非僅由單個科創中心的算力構成,還將融匯全國各地多個科創中心節點,供給於産業。
數據層麵,以AIPARK智能交互終端采集的本地數據、特斯聯自身近萬項目積纍的産業數據、與地方政府大數據局的閤作數據,以及科研公開數據為基礎,德陽科創中心目前已接入89TB數據。特斯聯科創中心將算力下沉到數據端組成智算節點,通過聯邦學習體係,使數據對研究機構可用及部分有條件可見。科研機構隨即通過智算節點,基於聯邦學習實現預訓練模型的研究。預訓練模型則可通過評測,上載到TACOS(特斯聯城市級AIoT操作係統)的九章算法賦能平台,為産業所用,實現産業算法的孵化。
算法模型方麵,基於前述體係,目前特斯聯在計算機視覺、自然語言處理、推薦預測、知識圖譜四個方嚮共十三個細分項,與學術生態及産業閤作夥伴展開深入閤作,並建立瞭龐大的模型庫。通過弱監督及大模型訓練體係,學術機構所研發齣的模型可實現在TACOS的掛載,並通過TACOS的AIDevelopStudio嚮産業提供算法訓練的服務。基於弱監督體係,中小微企業用戶可以基於無標簽數據進行算法訓練,降低算法對數據的依賴。同時弱監督及大模型訓練體係盡可能地降低瞭算法研發過程中的人工參與程度,讓算法訓練標準化、流程化。據特斯聯透露,入駐科創中心的企業均可通過TACOS及九章算法賦能平台直接調用相應的預訓練模型――截至2022年2月底,據TACOS顯示,已有逾800傢企業注冊九章算法賦能平台並入駐特斯聯科創中心,共計調用算法超過120萬次,而科創中心攜手學術生態也已纍計生成瞭數百個預訓練模型。
自研核心技術體係:以沉默數據降低AI研發門檻
據特斯聯科創中心負責人介紹,弱監督大模型訓練體係、聯邦學習安全訓練體係是科創中心最核心的技術亮點。
科創中心緻力於通過九章算法賦能平台嚮不具備AI能力或弱AI能力的用戶提供AI算法孵化服務能力,因而弱化機器學習對標簽數據的依賴、弱化人工參與算法訓練,就成瞭重中之重。
有彆於行業常見的算法研發範式,特斯聯將算力與數據相結閤,建立瞭特斯聯的智算體係,通過科創中心節點將算力下沉與數據綁定,形成算法+數據的分布式計算單元,並通過九章AI算法賦能平台的AIResearchStudio基於聯邦學習安全訓練體係將這一能力提供給科研學術生態。科研學術生態對於這些數據僅有部分有條件可見和使用的權限。基於這些分布式智算節點,科研學術生態可實現預訓練模型的研究,並將研究的預訓練模型通過評測後上載到九章算法賦能平台的AIDevelopStudio供産業使用,這些數據對於産業是完全不可見的。從技術上保證瞭數據的安全性。
在特斯聯看來,其打造的核心技術體係最關鍵的能力就在於,使城市中龐大的沉默數據資源,能夠真正有效地為産業所用。而這也是科創中心得以賦能企業AI開發的基礎。
2021年,特斯聯完成瞭基於弱監督和大模型核心技術的裏程碑級突破,並實現瞭與學術生態所研究的預訓練模型的一鍵加載。
“藍領”AI教培體係,反哺産業人纔缺口
不止於對企業的賦能,特斯聯對科創中心還有更高遠的野望。
藉由德陽科創中心的啓動,特斯聯宣布將正式升級其人纔戰略,在不斷投入加碼自身研發團隊的基礎之上,還將構建完善的“藍領”AI教培體係,為産業源源不斷輸送AI人纔。
據介紹,特斯聯的“藍領”AI教培體係將以科創中心為實踐基地,以TACOS及九章算法賦能平台為基礎展開。麵嚮廣泛的本地高職專院校,特斯聯將打造係列基於TACOS的AI教培課程、教材、軟硬件實訓及考核方案,為高職專學生提供基礎AI能力支持。以科創中心為橋梁,高職專學生得以針對企業具體的需求進行AI實習實踐,學以緻用。同時,特斯聯還將充分拉通産學研各界,以最新研究成果賦能前沿産業AI發展,打造從科研到應用的AI發展閉環。
從研發到應用,再以市場反饋反哺科研創新,這對於AI産業來說是一個螺鏇式發展的過程。藉由科創中心,特斯聯希望能進一步縮短AI技術從實驗室到市場的路徑,使研發更具場景針對性,也使市場的需求能更快速地為研究機構所瞭解。
曆經逾60年,人工智能已從最初的計算、感知階段發展到認知階段,而下一階段的突破離不開更靠近市場的應用實踐。通過打造集算力、數據、算法模型能力於一體的科創中心,特斯聯要做的是為各類企業打造流程化、低門檻的AI基礎設施,讓更多玩傢參與到AI發展的浪潮之中,讓AI更‘接地氣’,也為産業輸送更多AI人纔。
據悉,2022年,特斯聯還將進一步在瀋陽、重慶等AIPARK落地科創中心,讓AI産業在全國範圍內高速、高質量發展。
(編輯 田鼕)