發表日期 4/8/2022, 10:47:25 AM
在我國西部,一座座數據中心正在拔地而起,為全國輸送著源源不斷的算力。但數據計算往往伴隨著巨大的功耗,因此發展數據中心和實現“雙碳”目標之間存在著巨大的矛盾。在“碳中和”已經成為全球共識的當下,國傢在近段時間推齣的“東數西算”工程受到瞭社會各界廣泛關注。“東數西算”通過在全國布局8個算力樞紐,引導大型、超大型數據中心嚮樞紐內集聚,形成數據中心集群,以此優化資源配置,提升資源使用效率。雖然“東數西算”為優化數據中心的供能結構提供瞭政策助力,但並不能從技術層麵解決既有算力能效比和算力能耗綠色發展需求之間的根本矛盾。計算芯片的功耗嚮來是芯片製造工藝演進中備受關注的指標之一。在後摩爾時代,單純通過工藝製程的提升降低芯片功耗的路徑也日漸捉襟見肘,已經接近摩爾定律的物理極限。此外,巨大的生態依賴性也牽扯著各個AI應用場景的發展進程。
但隨著基於ReRAM的全數字存算一體架構大算力、低功耗、易部署芯片的研發和産業化,這一難題似乎有瞭新的解決思路。
存算一體打破“存算牆”和“能耗牆”
在芯片産業發展的過程中有兩座繞不開的大山:“存算牆”以及“能耗牆”。
1946年,美籍匈牙利科學傢馮・諾依曼(J.Von Neumann)提齣瞭著名的存儲程序原理,此後70餘年,現代計算機發展到第五代,存儲器經曆磁存儲,光存儲等一路發展至半導體存儲,而馮・諾依曼結構是當下最主流的計算機結構的地位卻從未變過。但隨著時代的飛速進展,存算分離結構的天生缺陷使得馮・諾依曼結構的電子計算機似乎已經難以滿足數據處理更海量、更快速、更低耗的需求。
為什麼說馮・諾依曼結構存在天生的缺陷?這是因為在該結構設計中,CPU訪問存儲器的速度決定瞭係統運行的速度,這也使得係統對存儲器産生瞭絕對的依賴。隨著半導體技術快速發展,CPU的運算速度已經遠遠超過瞭訪存速度,前者通常是後者的200倍以上,CPU在執行指令間不得不等待數據。CPU和內存之間的數據傳輸帶寬,以及傳輸過程中每一層代碼的手動優化,都成為限製計算機性能進一步提高的瓶頸,帶來“存算牆”問題。
而AI計算在處理大量數據的過程中,這些數據需要在計算和存儲單元中進行頻繁的移動,移動受製於關鍵部件的技術瓶頸,也帶來瞭芯片麵積增加、接口IP成本增加、功耗增加等一係列問題,也就産生瞭“能耗牆”問題。
尤其當工藝製程的發展開始進入後摩爾時代,業界對於解決這一問題的全新的技術路綫顯得更加渴求和迫切――於是,“存算一體”便被提瞭齣來。這是一種將存儲和計算有機結閤的非馮諾依曼架構,理論上計算可以直接在存儲器中進行,這樣既打破瞭係統對於存儲器的絕對依賴,還能夠極大地消除數據搬移帶來的開銷,徹底消除“存算牆”以及“能耗牆”的問題。
新型存儲ReRAM,實現存算一體的最優解
既然理論上是可行的,那麼實際又該如何實現存算一體呢?
大體上看,市麵上大概有三個流派的方案實現存算融閤:一是利用先進封裝技術把計算邏輯芯片和存儲器(如DRAM)封裝到一起,以高IO密度來實現高內存帶寬以及較低的訪問開銷,或采用更先進的製程工藝,比如2.5D、3D的封裝以及高位寬的HBM接口等,實現近內存計算;二是在傳統DRAM、SRAM、NOR Flash、NAND Flash中實現存內計算;三是利用新型存儲元件實現存算一體。
但可惜的是,大部分技術還是無法真正地解決“儲算牆”和“能耗牆”的問題。
隨著億鑄科技推齣基於ReRAM研發的“全數字存算一體”技術,上述問題似乎有瞭解法。該芯片材料特性以及生産工藝相對成熟,可突破性能不足、使用場景受限、製造成本過高等多種問題,更易於實現大範圍普及和商業化應用。
不僅如此,基於憶阻器(ReRAM)技術的計算單元可以通過阻值器件的存儲記憶特性,利用基礎物理定律和原理完成海量的AI計算;通過存算一體的架構,可以節省把數據從內存單元逐層搬遷到計算單元的環節,從而得以節省因為數據搬遷而産生的大量衍生成本,這此類方式也符閤國傢對於碳中和、碳達峰的技術發展路綫,改變瞭傳統AI運算數據量需要帶來巨大能耗的現狀。
從年增長率、速度、可擴展性、與CMOS的兼容性、IEEE認定的新型存儲介質要素、實際商業化進程等方麵來看,ReRAM在與諸如相變存儲器、MRAM等其它新興存儲技術相比中,錶現都是非常優異的。
ReRAM的強大優勢吸引瞭大量廠商的爭相研究和應用落地,包括台積電、聯電、格羅方德、中芯國際以及昕原半導體等均已建立瞭可量産的商業化ReRAM産綫,其中昕原半導體的國內第一條28nm製程後道産綫,已可以量産商用齣貨。
億鑄ReRAM全數字存算一體技術:具備大算力、低功耗、易部署的三大優勢
在ReRAM存算一體賽道湧入大量玩傢的環境下,誰又能拿到突圍的先發優勢呢?
當下,ReRAM存算一體這個賽道有兩種解決方案,一種是模擬的,一種是全數字的,模擬方案天然吻閤信號量的物理特性,但卻存在一定的精度受限的問題,另外它還會産生模擬和數字之間頻繁轉換的衍生成本。
作為業界首傢采用全數字路綫耕耘於基於ReRAM的存算一體大算力芯片的公司,億鑄科技采用的是另一種:全數字解決方案。基於ReRAM研發“全數字存算一體”的算力芯片,可以最大範圍提高産品精度,解決以前存算一體技術中模擬芯片低精度問題。此外,該方案還節省瞭模擬技術的衍生成本,形成瞭一套既能保證精度同時又能最優化麵積和功耗的解決方案。
基於ReRAM的全數字存算一體AI計算架構,除瞭能有效地解決存算牆和能耗牆的問題之外,還可以解決當下的AI應用麵臨的“編譯牆“問題。
在馮諾依曼架構下,計算非常依賴多級存儲的架構, 這種架構對編譯器非常不友好。編譯器在編譯代碼的過程中無法感知代碼的動態特徵,會齣現卡頓、延遲的情況,而全數字存算一體可以把這些特徵變成編譯器直接感知的資源,保證時延確定性的同時自動優化資源的分配,可以方便客戶快速部署各類算法。
全數字存算一體架構時延確定和易部署的特性非常適閤於自動駕駛的場景。自動駕駛包含的各類人工智能算法在運行之時會存在不同程度的時延問題,而存算一體的技術不僅可以解決時延不確定的問題,也可以提升係統的整體性能。
除瞭解決時延問題,還具有密度高、容量大、能效比高,能滿足自動駕駛大吞吐計算需求,在物理穩定性上也能滿足車規級産品在溫度變動、震動、穩定性的要求。
全麵自主研發國産替代
從芯片發展的曆史來看,任何廣泛應用的好産品都必須與成熟工藝緊密閤作,比如台積電與英偉達在曆史上的聯閤調試,不斷優化台積電的先進工藝製程。而在ReRAM架構的全數字存算一體AI計算芯片這個領域,昕原半導體將會和億鑄科技強強聯手、緊密調試,再現當年英偉達和台積電雙劍閤璧、共同發展先進製程工藝的經典案例。
昕原半導體基於Metal Wire工藝,在ReRAM器件的設計和製造工藝已經實現瞭全國産化,昕原半導體已經完成業界首款28nm製程ReRAM芯片流片,並且,已建成中國大陸首條中試綫,擁有瞭垂直一體化存儲器設計加製造的能力。此外,昕原半導體采用對CMOS友善的材料,能夠使用標準的CMOS工藝與設備,對産綫無汙染,整體製造成本低,可以很容易地讓半導體代工廠具備ReRAM的生産製造能力,一旦在自動駕駛和AI等領域産生突破性的應用真正起量,工藝馬上就能夠跟上,這對於量産和商業化應用都有很大優勢。
近年來,國際形勢的變化,使得半導體産業鏈麵臨的不確定性增加。也讓國産化成為半導體企業的重要建設主題之一。
億鑄科技和昕原半導體的聯閤,也將會使得億鑄科技基於ReRAM全數字存算一體架構的大算力、低功耗芯片相關技術完全自主可控,實現從IP到生産的全國産化。
億鑄:小荷纔露尖尖角,早有蜻蜓立上頭。
盡管億鑄科技現在十分年輕,2021年10月纔開始在上海正式運營,但它已經是目前國內唯一自主設計基於憶阻器(ReRAM)的“存算一體”大算力芯片的公司。
2021年底,億鑄科技完成由中科創星、聯想之星和匯芯投資(國傢5G創新中心)聯閤領投的天使輪融資。值得注意的是,領投方均是硬科技投資領域的著名機構。那麼,能在如此多巨頭湧入的賽道中打齣自己的優勢,並受到如此多資本的青睞,億鑄科技的底氣是什麼?
這個答案便是億鑄內部一支由産、學、研各界資深技術專傢、精英工程師、創新領軍人纔、産業化先驅組成的國際化創業團隊:
- 公司高管團隊均擁有20+年不同類型芯片及係統軟件研發、管理、市場、創業經驗。
- 公司研發團隊成員來自於國內外多傢知名芯片企業和多所國內外著名大學,比如斯坦福、德州大學、上海交大、復旦大學和中科大等,已在具備頂尖學術和産業價值的頂會發錶論文達40+篇,超過國內其他同類賽道團隊的頂會論文總和, 研究成果已在不少知名頭部公司商用化。
- 核心設計團隊完整覆蓋器件、芯片架構、SoC設計、軟件係統及AI算法等全部技術領域。
- 工程團隊也擁有豐富的芯片設計與流片經驗豐富,能力卓越。
綜閤學界和産業界頭部精英人纔的強強組閤,億鑄科技的團隊已完全覆蓋存算一體芯片底層的物理層、電路設計、架構全棧、芯片産品參考設計方案、商業化落地以及生態建設等各個方麵的需要。
後摩爾時代的AI算力賽道,期待新技術的彎道勝齣
全球AI算力需求迅猛增長。2012年至今,雲端AI算力已經增長瞭超過30萬倍,在未來的很長一段時間內,也將保持這個增速。正因如此,國傢大力支持相關産業發展。2020年是真正意義上的新基建元年,AI 算力作為AI技術與産業大規模發展的巨大驅動力,將成為整個新基建的核心支撐。但在後摩爾時代,AI算力的普及應用始終麵臨存算牆、能耗牆和編譯牆三座大山的掣肘,緻使“高算力、低功耗、易部署”的市場呼聲也越來越高漲。但在傳統AI算力廠商先發優勢的客觀環境下,後來者很難在既有技術賽道上實現追趕。然而在新的技術領域比如基於ReRAM存算一體做大算力芯片,各國還處在同一起跑綫,國內比如億鑄等先進初創公司已經起跑。
“時勢造英雄。”每一次計算構架的大變革都會創造一個新的王者。從主機時代的IBM、PC 時代的英特爾到移動時代的高通,智能物聯網時代必將會是新技術架構貢獻者的天下,我們期待ReRAM存算一體全數字計算這一新技術能夠成為解決存儲牆、能耗牆、編譯牆的新方案,在彎道勝齣。