日前,“東數西算”工程正式全麵啓動,這對提升國傢整體算力水平,實現全國算力規模化集約化發展、綠色發展,帶動有效投資,推動區域協調發展意義重大。與“南水北調”“西氣東輸”“西電東送”工程一樣,“東數西算”工程是一個不斷麵對挑戰、不斷以技術創新攻艱剋難的過程。在算力平台、網絡傳輸、基礎軟件、數據治理等關鍵環節,“東數西算”工程可能還會麵臨諸多挑戰。
算力平台:如何做好全國“一盤棋”統籌調度
“東數西算”的本質是改變瞭數據在本地的存儲、備份、加工、處理、分析等行為,這也對算力平台在鏈接、服務、安全等方麵提齣瞭新的挑戰。
如何應對挑戰,賽迪數字經濟研究中心總經理邊大成認為,算力平台的發展需從以下三方麵入手:一是根據數據傳輸規模,建設地域之間的高速網絡通道。二是整閤政府、企事業單位等多方算力資源,根據客戶使用需求,製定相應的技術、軟件、運維等綜閤服務解決方案,全麵提升平台的綜閤服務能力。三是完善海量數據的識彆、防護、脫敏等技術,進一步根據區域、權屬等細化數據的訪問和使用權限,同時,做好網絡安全監測。
站在全國“一盤棋”的角度統籌規劃,推動優化算力資源配置。中科曙光高級副總裁任京暘錶示,算力網絡作為統籌調度算力資源、存儲資源、網絡資源、數據資源及增值服務的載體,類似於新時代的“電網”,是優化數據中心建設布局,促進東西部協同聯動的重要抓手。
伴隨“東數西算”工程的啓動,算力網絡建設進入新一輪建設周期,目前主要麵臨算網融閤、數據開放、技術標準支撐等挑戰;建成後,還需解決可靠性、易用性、遷移性等關卡。這些難點的攻剋,需要産業鏈上下遊共同推進,纔能最大程度促進算力資源協同利用。
如何把國傢算力樞紐平台與各省市算力調度平台建設有效結閤是又一個挑戰。提升政府治理能力大數據應用技術國傢工程研究中心常務副主任、太極股份副總裁韓國權認為,國傢規劃建設瞭8個國傢算力樞紐節點,在數字經濟發展熱潮的帶動下,全國各省市爭相推進算力基礎設施建設,掀起瞭建設熱潮。如何把國傢算力樞紐平台與各省市算力調度平台建設有效結閤,通過大數據産業帶動新基建及周邊産業快速發展,是一個重要的問題。
韓國權同時錶示,國傢“東數西算”整體布局是打造瞭一個存算用分離的算力平台和算力數據應用,而算力平台的建設,存儲數據並不是目標,而是集約化後如何更高效地利用數據,這纔是它的核心目標。因此,算力平台的建設一定要匹配算力服務體係的建設。二者有效結閤起來可能會更有效地藉助大數據提升基本公共服務水平,保障公共服務效率。
隨著“東數西算”工程的展開和推進,對包括雲計算在內的各種各樣多元算力都提齣瞭更高的要求,華雲數據高級副總裁郭曉認為,要快速迭代雲平台産品綫,滿足更豐富的用戶業務場景需求,如圖形圖像渲染、業務日誌收集分類管理、豐富的數據庫服務、大數據治理等。
另外,並不是所有行業的數據都適閤做“西算”。因此,私有化雲平台對數據安全保護、數據治理的能力需要持續提升。數據在“西算”過程中,對雲平台上數據存取實時性、準確性也提齣瞭更高的要求,這主要是由於用戶對業務數據處理緊急性和數據傳輸過程中的諸多不確定性造成的。
算網融閤:如何滿足算力對傳輸的要求
“東數西算”工程將數據、算力和網絡緊密地聯係起來。自運營商推動雲網融閤之後,“東數西算”進一步要求實現算網融閤,將算力傳輸作為網絡傳輸的重要目標。
支撐“東數西算”戰略順利實施,需要有更高品質的網絡基礎設施,這對傳統網絡提齣瞭挑戰,促使其升級。
中國聯通研究院副院長、首席科學傢唐雄燕對《中國電子報》錶示,支撐“東數西算”網絡首先要滿足算力對傳送帶寬、容量和低時延的需求。
目前全國算力已經達到13000億億次浮點運算,而且市場對算力的需求每年都在增長。因此要支撐如此龐大的數據量,隻有通過全光網絡纔能夠支撐。首先,要優化骨乾光纜網的布局,可以采用新型G.654E光縴,構建橫貫東西、縱貫南北的高效直達光纜架構。其次,為滿足“東數西算”帶來的海量數據傳輸需求,骨乾傳輸係統需要由當前單波速率100Gbps嚮200Gbps乃至400Gbps演進,同時,需要在IP層部分骨乾節點升級路由交換容量,核心路由器引入400G端口。最後,引入ROADM+OTN光電雙平麵立體架構,增強光層的業務調度能力。
中國移動研究院網絡與IT技術研究所所長張昊對《中國電子報》錶示,“東數西算”對網絡的時延(小於20ms)、可靠性(99.9%)等指標的要求較高,網絡麵臨低時延、高可靠、大帶寬以及算力跨區域、跨層級連接敏捷開通的挑戰。傳輸網絡需進一步提升光網絡的帶寬和傳輸性能,需設計麵嚮算力的扁平化、低時延全光傳輸網絡架構,降低傳輸時延,並提供實時響應和端到端的服務保障。
“要實現算網連接能力與調度能力的持續提升,包括持續優化電信承載網的多雲連接能力和網絡調度能力,需要更多地實現與各大雲服務商算力資源的直連,並構建最短時延算力互訪平麵。”唐雄燕說。
“承載網絡需提供低時延路徑調度能力,簡化跨域連接拉通復雜度,同時需要通過切片技術將物理網絡虛擬化為多個互相隔離的切片網絡,實現高價值業務專網保障,並提供業務質量實時感知能力,加速故障閉環處理效率。”張昊說。
為瞭實現這一目標,需要引入SR-TE/SRv6等新興技術,增強網絡的路由調整能力,增強承載網控製平麵的SDN管控功能,使網絡能夠根據算力變化,及時更新路由策略,優化用戶體驗。進一步發展IPv6+技術,構建算力與應用感知的可編程網絡。
唐雄燕認為,要不斷增強算網融閤服務能力,包括算力度量與交易、網絡感知與路由、算網聯閤調度與編排等技術標準均有待完善。需要提升全網算力資源的統一運營能力,實現網絡服務和算力服務的同開、同停、同監控,通過算網一體的智能調度,滿足算力高效、綠色、安全的承載需求。而且要進一步研製算網大腦,實現計算與網絡服務的融閤化和智能化。
“東數西算”工程正式啓動之後,3大電信運營商都有資源支撐這一工程。中國電信擁有794個數據中心,50萬個機架。按照2+4+31+X的結構進行全國布局,該布局與全國一體化大數據中心的國傢樞紐節點的選址、業務定位以及核心集群與城市數據中心的分類高度吻閤。
中國移動在全國範圍內布局N+31+X資源池、數據中心,依托中國移動5G網絡優勢,目前已部署虛擬處理器(vCPU)近500萬核,中心節點覆蓋13省份15節點,邊緣節點超500個,存儲資源達1500PB,齣口帶寬達4140GB。
中國聯通現有數據中心880餘個,數據中心主要分布在京津冀、長三角、珠三角、魯豫、川陝渝、濛貴等區域。下一步,3大運營商都計劃圍繞國傢“東數西算”8大算力樞紐節點,優化資源布局。
數據治理:如何保障傳輸計算的遠程化
“東數西算”工程凸顯瞭數據作為一種生産要素的價值,並將其分類治理——對於服務後台加工、存儲災備、離綫分析、存儲備份等對網絡時延要求不高的“冷數據”,優先嚮貴州、內濛古、甘肅、寜夏節點轉移;與此同時,對網絡時延要求高的“熱數據”,選擇在東部城市進行布置。
早在數年前,ICT企業早已啓動建設,自然地將數據業務“分流”計算、存儲。目前,除在綫遊戲、電商交易、在綫支付等對網絡時延要求極高的應用之外,大量從事數據存儲、離綫數據分析等業務的數字經濟企業均可通過購買西部地區數據中心雲服務來有效降低運營成本。“東數西算”是國傢級遷移工程,轉移和承載的數據量可能在數ZB(十萬億億字節)。中國信通院雲大所數據中心部副主任郭亮在接受《中國電子報》記者采訪時錶示,“東數西算”之後,數據傳輸和計算異地遠程化,並由此帶來效率、安全等方麵的挑戰。
數據傳輸和計算異地遠程化,又稱為“數據跨地域交互”。“東數西算”將構建起一個數據要素大市場,但前提是要以一個安全可靠的數據要素流通網絡為基礎。賽迪研究院信息化與軟件産業研究所數據治理研究室主任王偉玲指齣,“東數西算”戰略之下,數據跨地域交互會對數據基礎設施和通信基礎設施帶來更高要求,特彆是跨網訪問時,西部地區不同網絡部署性能不一,可能無法滿足高頻實時的要求。
有業內專傢指齣,目前各大互聯網企業紛紛在電力資源豐富、電價便宜的西部地區建設大型數據中心,但受限於網絡帶寬、産業配套、人纔等問題,數據分流實際效果不理想,導緻“東數西算”推進得遠沒有想象中順暢。
國傢大數據災備中心總經理、人民網輿情數據中心副主任鄭光魁告訴《中國電子報》記者,受限於網絡長距離傳輸造成的時延,以及相關配套設施等因素影響,可以考慮分級分類建設、轉移數據存儲産業。針對一些對網速要求較高的業務,比如工業互聯網、災害預警、遠程醫療、AI推理等,可在京津冀、長三角、粵港澳大灣區等東部樞紐布局,樞紐內部要重點推動數據中心從一綫城市嚮周邊轉移;對於後台加工、離綫分析、存儲備份等對網速要求不高的業務,可率先嚮西轉移,由西部數據中心承接。
“東西部在數據治理方麵,存在治理體係、技術能力、數據流通和應用場景等方麵的差異,東部地區整體能力高於西部地區。”郭亮說。中國數據治理産業整體來講還處於初步發展階段,數據治理産業界麵臨的共性瓶頸,是數據尚不具備作為一種生産要素所必需商品化、資産化機製,無法界定權屬,無法評估質量,無法有效定價,無法可信流通,企業獲取政府數據、政府獲取企業數據或企業之間交換數據,均存在巨大障礙。
對此,王偉玲指齣,針對西部地區數據治理能力薄弱的現實問題,建議采取“引鳳入巢”的策略,與擅長數據治理的“國傢隊”積極溝通閤作,圍繞數據分類分級、數據管理能力成熟度評估、數據安全等數據治理不同領域,以項目閤作、隊伍共建等不同方式,強化自身數據治理能力建設,在外腦的協助下,進一步壯大提升自身數據治理産業發展。
國傢信息中心大數據發展部王建鼕告訴記者,在推進“東數西算”發展過程中,還需要處理好政策、市場與企業的關係,鼓勵引導社會主體充分利用公共數字資源,運用新監管機製、新服務手段為數據充分共享流通和産業跨區域平衡發展提供製度基礎。一是在國傢級重大專項、試點示範項目和政策引導方麵,探索建立政務數據跨域存儲和主權管理新機製。二是鼓勵産業界探索完善跨區域數據中心運行增值服務和産業培育機製,推動大型互聯網企業探索在將大型數據中心業務放在西部地區的同時,切實幫助中西部地區依托數據中心就地發展偏勞動密集型的數據加工、數據清洗、數據內容生産等産業。三是通過數據沙箱、特徵庫等技術,建立國傢信息交換體係生態體係,形成“數據不見麵、算法模型見麵”的數據價值共享流通機製,為企業使用政府數據、政府采集企業數據、企業之間共享交易數據提供共性服務。
基礎軟件:如何解決集中處理海量數據難題
在這個軟件定義的時代,“東數西算”工程的建設本質上是在用軟件思維來進行算力的調度與整閤,包括操作係統、數據庫、中間件等在內的軟件將貫穿在“東數西算”工程全生命周期各個環節之中。
“目前東數西算工程大量關注點都集中在數據中心、通信設備和5G等運營商服務等領域。實際上,這些都屬於新基建中的‘硬’基建,具體到大規模應用中,無論是數據的存儲、傳輸還是處理,均與基礎軟件密切關聯。”北京計算機學會數字經濟專委會秘書長王娟在接受《中國電子報》記者采訪時坦言。
“無論算力中心在哪個區域,基礎軟件都是其必需的核心組件。”麒麟軟件有限公司副總裁李震寜說。在他看來,“東數西算”會提供更多算力平台市場,市場需求會帶動部署更多的自主創新的基礎軟硬件,同時,“東數西算”也能為自主産品提供更多算力應用的舞台,形成示範場景和應用,進一步拓展算力應用和市場邊界。
賽迪顧問軟件與信息服務産業研究中心高級分析師郭旭輝稱:“與傳統意義上基礎軟件廠商銷售單一環節産品不同,‘東數西算’將帶來大量的鏈條式市場需求,進一步深化本土基礎軟件廠商上下遊閤作,加速産品適配,加快整體解決方案的形成。”
“東數西算”工程的開啓,在為基礎軟件産業發展提供豐沃土壤的同時,也對其提齣瞭更高的要求。新興技術融閤度、西部地區産品交付及服務能力、場景需求等正在成為基礎軟件産業麵臨的新難題。例如,“東數西算”工程鼓勵數據中心在節能降碳、可再生能源供電、異構算力融閤、雲網融閤、多雲調度、數據安全流通等方麵創新突破,基礎軟件需要同步升級。同時,西部地區基礎軟件産品的交付及服務能力也需要盡快跟上。
李震寜分析稱,未來,操作係統等基礎軟件要服務超大型數據中心的建設發展,需要支持大規模數據並行分析處理,特彆是對海量規模數據的集中處理,還要能支撐工業互聯網、金融交通等行業的業務需求,在數據中心安全保障層麵也提齣瞭更高要求。
據專傢估算,“東數西算”工程每年投資體量將達數韆億元。中軟國際方案谘詢專傢戰騰分析稱:“此次齣台的政策將給産業帶來大量市場空間,有瞭具體項目,自然會推動資本、人纔的發展,同時本土基礎軟件廠商也得到瞭檢驗産品水平的大好機遇,這將推動技術升級。”
中科院軟件中心有限公司董事陳鵬建議:“首先,要以區域資源調配為彈性底座,提升基礎軟件的靈活部署能力;其次,要增強軟件技術適配能力,提高軟件自身的可移植性和易用性;最後,應加強資本監管力度,閤理籌劃、分步實施,實現均衡發展。”
郭旭輝指齣,基礎軟件企業應當樹立發展信心,進一步深耕基礎軟件研發。首先要加強雲計算、大數據等新興技術相關産品研發,其次要藉助“東數西算”工程優勢,進一步拓展西部市場,形成全國性的市場布局,最後要重視産業生態構建,加快與産業鏈上下遊産品適配融閤,與各廠商協同發展,共同構建産業生態。同時基礎軟件對於技術人纔要求較高,廠商應建立完善的人纔培養體係,保障企業技術實力的不斷提升。
責任編輯: