發表日期 2/25/2022, 8:28:24 PM
智東西(公眾號:zhidxcom)
作者 | 楊暢
編輯 | 李水青
智東西2月25日消息,近日,“東數西算”國傢項目正式啓動,為數據中心産業帶來瞭重要利好信號。(《曆史時刻!“東數西算”國傢工程全麵啓動》)
作為數據中心中領域的一顆“明珠”,智算中心也引起行業關注。
一般認為,智算中心全稱是人工智能計算中心,主要是為人工智能(AI)應用提供所需算力服務、數據服務和算法服務,由AI芯片和算力機組等設備組成,與雲計算中心、超算中心有一定區彆。企業和研究機構可以依托智算中心提供的強大算力,驅動AI模型進行數據深度加工,實現AI應用創新。
“東數西算”國傢項目強調在京津冀、長三角、成渝等八大樞紐間建設算力網絡,支持全國各地日益增長的算力需求。而沿著這張算力網絡“地圖”,我們發現智算中心已經“遍地開花”。
細數過來,從2021年到2022年開年,全國有不下20座城市建成或正在建智算中心,智算中心數量達到27個,而其中位於八大樞紐的就有12個,接近50%。
▲“東數西算”工程國傢算力樞紐節點範圍內的智算中心
那麼具體有哪些城市在建設或者規劃建設智算中心?“東數西算”工程會對智算中心帶來什麼樣的影響?各地智算中心項目建設進度如何?可能會對當地AI産業有何影響?
智東西通過調查2021年以來各地規劃、建設和建成的智算中心,並與業內人士交流,來與大傢一起探討這些問題。
一、26城開建智算中心,華為曙光等是贏傢
據智東西統計,從2021年1月1日到2022年2月15日,全國共有至少26個城市在推動或剛剛完成當地智算中心的建設,這些城市中既有省會城市,例如南京、西安,也有非省會城市,像許昌、青島。
其中,不少城市已經在本地建設瞭像大數據中心、雲計算中心、國傢超算中心等信息基礎設施。不過這些中心並不能替代智算中心,它們之間的功能存在差異――像雲計算中心,主要是提供雲服務,超算中心主要為科學研究提供超算服務,智算中心則主要是為企業和科研院所提供普惠AI算力服務。
此外,中信所《人工智能計算中心發展白皮書(2021)》中指齣,智算中心藉鑒瞭超級計算(高性能計算)中心和雲計算數據中心大規模並行計算和數據處理的技術架構,但它是以AI專用芯片為計算算力底座的。上述三類中心的軟件和業務架構不一樣,不過雲數據中心和超算中心也可以通過延展建設,來對外提供智能算力。
據我們統計,2021年,全國建成並投入運營或試運營的智算中心有8個,分彆是武漢人工智能計算中心、閤肥先進計算中心、南京智能計算中心、中國電信京津冀大數據智能算力中心、浙江(長三角)新一代全功能智能超算中心、西安未來人工智能計算中心、中原人工智能計算中心、哈爾濱人工智能先進計算中心,投運時間分彆是5月、6月、7月、8月、9月、9月、10月和12月。這些智算中心中大部分都有二期建設規劃。
▲截至目前,2021年和2022年各地投入運營的智算中心情況
一些智算中心並沒有直接用“智算中心”或“人工智能計算中心”命名,而是采用“先進計算中心”或“智能超算中心”的命名方式,但它們也提供智能算力,所以也可以算作智算中心,例如閤肥先進計算中心和浙江(長三角)新一代全功能智能超算中心。
不同智算中心的測算算力時采用的算力測試基準有所差彆,使用算力單位略有不同,但是無論是“1 P OpS”、“1 PFLOPS FP16”、“1 Petaflops”還是“1 P”,都相當於每秒可進行一韆萬億次運算。
2022年開年以來,國內已經有一個新投運的智算中心,是位於上海的商湯科技人工智能計算中心。
很多城市是正在建設智算中心,從2021年1月1日到2022年2月15日,全國共有至少18個城市簽約、開工、招標、計劃建設智算中心項目,其中已經宣布開工建設的至少有6個城市,分彆是閤肥、慶陽、大連、瀋陽、深圳、長沙。
▲截至目前,2021年和2022年各地規劃或已經開始建設的智算中心情況
對比2021年之前的各地智算中心建設情況來看,2020年之前的智算中心項目更少一些。不過,部分2021年開工建成的智算中心其實在2020年就已經立項招標和預研規劃,比如武漢人工智能計算中心項目。
智算中心並不是2021年纔有的新類型數據中心,我國較早建成的智算中心還有深圳鵬城雲腦、曠視蕪湖AI超算中心等。2018年,鵬城雲腦I初步建成並上綫運行,算力達到100 PFLOPS(1 PFLOPS相當於每秒運算能力為一韆萬億次)。
二、100P算力起步,還沒建成就被“約滿”
從全國智算中心的地理位置分布來看,目前,東部、中部和西部都有省市在部署智算中心。作為數據中心的一種,各地的智算中心建設規劃難免會受到“東數西算”政策的影響。
特彆是國傢發改委等部門在《全國一體化大數據中心協同創新體係算力樞紐實施方案》等文件中指齣:“原則上,對於在國傢樞紐節點之外新建的數據中心,地方政府不得給予土地、財稅等方麵的優惠政策。”智算中心作為各地政府主導的項目,極有可能受到影響,但是並不一定會大批嚮西部地區遷移。因為智算中心主要麵嚮AI相關産業,這些業務對於網絡通信的要求也比較高,在這方麵,東部地區略有優勢。
中科曙光高級副總裁任京��告訴智東西,“東數西算”工程會促進智算中心的發展,預計在全國一體化算力網絡國傢樞紐節點建設中,規劃的數據中心項目會配置一定規模的智能算力,有些項目還可能是直接以智算中心的形態齣現。
另外,從這些智算中心公布的算力規模情況來看, 100P算力是很多智算中心的起步目標 。
一般認為,100P大約相當於5萬台高性能電腦的算力。拿科研場景為例,天文學傢在20萬顆天體的星空圖中要定位某種特徵星體,如果算力不夠,耗時可能要超100天,如果擁有100P算力,定位星體所需時間僅為100秒。
任京��說,一般智算中心提到的100P是指FP16或INT16,即半精度算力,就現階段而言,以100P起步,能實現比較大的規模效益。
從需求角度看,智算中心作為城市級公共算力平台,要滿足區域內政府、企業、高校等各類用戶的算力需求,起步規模不宜過小,否則無法支撐類似大模型訓練等大算力需求,也不足以發揮集約共享的規模效益。
任京��補充道,從投資角度看,智算中心發展尚處於初期階段,建設、運營、應用與生態建設等投入較大,需要結閤地方財政承受能力做齣閤理評估,根據實際需求進行適度的超前部署。
大部分智算中心都是分期建設的,建成一期,就可以投入運營一期,後期再根據運行情況和産業發展需求進行二期、三期建設。
例如武漢人工智能計算中心,該智算中心在2021年5月完成瞭一期項目建設工作,並開始為企業提供AI算力,但很快飽和瞭。於是,武漢人工智能計算中心又進行瞭二期項目擴容工作,將算力規模從100P擴容到200P。武漢人工智能計算中心相關負責人在接受媒體采訪時說,現在二期算力也接近飽和,隨著準備進行進一步的算力擴容工作。
▲武漢人工智能計算中心
根據各智算中心的數據,至少數百傢企業已經簽約智算中心,例如武漢人工智能計算中心已經為多傢高校和科研院所、100多傢企業提供算力,南京智能計算中心已經吸引超40傢産學研機構入駐。
一個智算中心可以同時支撐的産業場景很多,例如自動駕駛、智慧醫療、智慧城市、智慧交通、智慧礦山、智能製造等等,主要看當地的需求,一般都是為瞭支撐當地的優勢産業更好發展。比如,青島靠近海域,其人工智能計算中心招標文件就有提到青島人工智能計算中心要支撐青島優勢産業集群,比如智能傢居、智能製造等産業智能化持續領先,並著重強調支撐當地智慧海洋經濟的發展。
上述智算中心都並不局限於支撐單一産業。不過,也有一些城市選擇建設針對性更強的智算中心,像山西晉城建設瞭專門麵嚮煤炭行業的智算中心(智能礦山創新實驗室創新成果&計算中心)。該智算中心由華為、晉能控股等企業參與建設,主要是為推動山西煤礦智能化建設。
▲智能礦山創新實驗室創新成果&計算中心
三、地方智算中心大潮背後的科技力量
在智算中心建設過程中,市政和建築設計企業背後的AI和ICT企業是重要角色,例如曙光、華為、浪潮、騰訊、商湯科技等企業。
在探索智算中心過程中,作為計算領域的頭部玩傢曙光提齣瞭“5A級”智算中心建設方案,從開放、融閤、綠色、普惠、服務五個方麵,進行智算中心相關的實踐和探索。目前,曙光5A級智算中心已在廣東珠海、安徽閤肥、浙江桐鄉等地陸續落成,其江蘇昆山等地的智算中心也進入建設階段。
▲閤肥先進計算中心
曙光智算中心會采用兼容多種芯片、算法、模型等的多元協作方式以實現多元算力提供。例如曙光參建的閤肥先進計算中心不僅能提供智能算力,還能提供高性能計算所需算力。在降低智算中心、數據中心能耗方麵,曙光研發有浸沒式相變液冷技術,可使智算中心的PUE值降至1.04到1.05。
華為應該是比較早嘗試智算中心的企業,而且也是參與各地智算中心建設最多的企業之一。華為�N騰計算業務總裁許映童曾在2021世界人工智能大會期間透露,華為希望在2021年內啓動超20個智算中心建設。
包括“鵬城雲腦II”、“武漢人工智能計算中心”在內的幾個華為承建的智算中心項目幾乎都是使用華為的Atlas 900 AI集群架構,來實現AI算力供給的。Atlas 900 AI集群架構是由數韆顆�N騰910 AI處理器構成,其總算力達到256P~1024 PFLOPS FP16。
▲鵬城雲腦
浪潮在智算中心方麵也有多年的研究,無論是智算中心運行過程中算力生産、算力聚閤、算力調度還是算力釋放環節,浪潮都分彆有相應的技術和軟硬件支撐。南京智能計算中心就是采用瞭浪潮AI服務器算力機組和寒武紀思元270和思元290智能芯片及加速卡。
▲南京智能計算中心
作為數據中心行業的重要玩傢,騰訊將其在數據中心方麵的探索應用在瞭智算中心建設中,像騰訊智慧産業長三角(閤肥)智算中心建設中就用到瞭騰訊第四代T-Block等高端模塊化技術,支持項目快速交付。騰訊第四代T-Block等高端模塊化技術就是將IT、空調等數據中心的各個功能模塊化,以實現按需靈活配置。
商湯科技是從2018年開始進行人工智能計算中心預研工作的,2020年7月開始商湯科技人工智能計算中心建設工作。2022年1月24日,商湯科技人工智能計算中心啓動運營。商湯科技人工智能計算中心的峰值算力高達3740 Petaflops,這背後包含瞭商湯科技的多種技術突破,包括高性能計算、分布式調度、硬件/軟件協同設計等。
▲商湯科技人工智能計算中心
結語:2022年大批智算中心將建成投運
我們通過調查2021年以來建設和建成的智算中心,發現越來越多的城市已經開始瞭智算中心建設。這體現瞭各地對於AI産業的重視。從一些現有的智算中心建設工期來看,一般一期建設大概時間在半年到一年不等,今年可能會有更多在建的智算中心建成並投運。另外,“東數西算”工程也會對新的智算中心的規劃、建設産生多重影響。
目前參與智算中心建設的企業相對有限,隨著各地對智算中心建設需求的增加以及一些新玩傢加入,智算中心領域玩傢可能會麵臨更激烈的競爭。