創(chuàng )投旗艦店 | 打破存儲墻——存算一體技術(shù)的突破與未來(lái)
發(fā)布時(shí)間:
2025-04-02
來(lái)源:
如果您對文章有更深入的見(jiàn)解與想法,可以聯(lián)系本文作者:南京市創(chuàng )新投資集團投資五部 許希文 xuxw@njicg.com
引言
近年來(lái),人工智能技術(shù)的廣泛應用深刻改變了我們的生活,從抖音等平臺精準推薦短視頻內容,到自動(dòng)駕駛系統智能識別復雜場(chǎng)景,從優(yōu)化物流配送路徑的算法,到實(shí)時(shí)翻譯多國語(yǔ)言的智能助手,這些便利的實(shí)現背后都依賴(lài)于強大的算力支持。然而,在算力需求持續攀升的背后,一個(gè)隱藏的瓶頸正逐漸顯現——“存儲”與“計算”之間的分離問(wèn)題。
自馮·諾依曼架構奠定現代計算機基礎以來(lái),計算單元與存儲單元的分離設計成為主流。二者之間通過(guò)數據總線(xiàn)進(jìn)行交互,類(lèi)似于兩位分工明確的工人:一位負責處理數據,另一位負責存儲數據。然而,隨著(zhù)數據規模的指數級增長(cháng),這種架構的局限性愈發(fā)突出。數據在存儲單元與計算單元之間頻繁搬運,不僅耗費大量時(shí)間,還導致能耗急劇增加。據統計,在高算力場(chǎng)景中,數據搬運的能耗占比已超過(guò)80%,成為制約算力進(jìn)一步提升的關(guān)鍵瓶頸——即所謂的“存儲墻”。
在人工智能時(shí)代,算力被視為推動(dòng)科技發(fā)展的核心引擎,而“存儲墻”無(wú)異于壓制引擎性能的一塊巨大障礙。如何突破這一限制,充分釋放算力潛力?“存算一體技術(shù)”應運而生,為解決這一問(wèn)題提供了全新的路徑。
一、馮·諾依曼架構與存儲墻
1.1 馮·諾依曼架構的輝煌與局限
馮·諾依曼架構是現代計算機設計的基礎,由約翰·馮·諾依曼在1945年提出。這種架構的特點(diǎn)是,程序和數據存儲在同一個(gè)存儲器里,并通過(guò)一條通道(總線(xiàn))傳輸給處理器執行。如圖1所示,處理器包括兩個(gè)主要部分:計算單元(負責運算)和控制單元(負責讀取指令并指揮操作)。雖然這種設計簡(jiǎn)單清晰,但也有明顯的缺點(diǎn),即 “馮·諾依曼瓶頸”:指令和數據必須通過(guò)同一條通道排隊傳輸,導致速度變慢;同時(shí),處理器的運算速度遠快于存儲器的數據傳輸速度,常常需要等待數據,影響效率。盡管如此,這一架構仍是現代計算機的基礎,通過(guò)加入緩存和流水線(xiàn)技術(shù),極大提升了運算速度,為計算機的發(fā)展鋪平了道路。
圖1 馮·諾依曼架構示意圖
然而在如今的人工智能時(shí)代,算力需求以指數級增長(cháng),這一傳統架構的局限性也逐漸顯現:數據需要在存儲與計算單元間頻繁傳輸,大量的時(shí)間和能量被浪費在了數據“搬運”上。這堵無(wú)形的“存儲墻”,正成為限制算力發(fā)展的關(guān)鍵瓶頸!
存儲墻瓶頸在高算力任務(wù)中表現尤為明顯?,F代AI計算對存儲帶寬的需求已高達1PB/s,而主流存儲器的速度卻遠低于這一標準,例如SRAM的傳輸速度僅為10-100TB/s,DRAM更低,僅為40GB-1TB/s,二者之間的差距達到數十甚至上百倍。這種速度差使得計算單元難以充分利用性能,系統的整體效率被大幅拖累。此外,數據搬運的高能耗也是存儲墻的重要表現,在自然語(yǔ)言處理類(lèi)任務(wù)中,數據搬運占據了總能耗的82%。這種瓶頸限制了AI、大數據等領(lǐng)域算力的進(jìn)一步提升,并導致高昂的成本與能耗,成為現代計算架構必須解決的核心問(wèn)題。
圖2 計算與存儲的能耗對比圖
1.2 打破存儲瓶頸:存算一體的崛起
阿姆達爾定律:指明優(yōu)化方向
阿姆達爾定律由計算機科學(xué)家吉恩·阿姆達爾提出,用于衡量系統性能提升的極限。它指出:一個(gè)計算系統的整體加速比,取決于任務(wù)中串行部分的比例。如圖3所示,S代表加速比,即使用 n個(gè)處理器后性能提升的倍數;P為程序中可并行化的部分比例;(1-P)即為程序中必須串行完成的部分比例;n為并行使用的處理器數量。理論上,當 P 越大時(shí),可并行化的任務(wù)越多,加速效果就越好。但當處理器的數量(n)無(wú)限增加時(shí),系統加速比將會(huì )無(wú)限趨近于1/(1-P),也就意味著(zhù)即使并行部分得到極大的優(yōu)化,串行部分的存在依然會(huì )限制整體性能的提升。
圖3 阿姆達爾定律
在馮·諾依曼架構下,數據的搬運屬于典型的串行任務(wù),其傳輸速度遠低于計算速度,導致處理器等待時(shí)間過(guò)長(cháng),成為系統性能的核心瓶頸。因此,根據阿姆達爾定律,優(yōu)化系統性能的關(guān)鍵在于減少甚至消除串行部分的數據搬運,即打破“存儲墻”。這為現代計算架構的優(yōu)化指明了方向:存儲與計算的深度融合。
存算一體技術(shù):解決存儲墻的關(guān)鍵路徑
為了應對存儲瓶頸問(wèn)題,存算一體技術(shù)應運而生。存算一體的核心思路是通過(guò)存儲與計算的物理融合,顯著(zhù)減少數據搬運需求。目前提出了三種主要解決方案:
?、俳嬗嬎?PNM,Processing Near Memory):通過(guò)將計算單元放置在存儲單元附近,縮短物理距離,減少數據傳輸的時(shí)間和能耗。PNM相較于傳統架構提高了效率,但數據搬運仍然存在,未能完全解決問(wèn)題。
圖4 近存計算示意圖
?、诖鎯忍幚?PIM,Processing In Memory):如圖5所示,將簡(jiǎn)單的計算功能嵌入存儲器內部,例如嵌入加法器或乘法器,用于執行特定的任務(wù)(如矩陣運算)。PIM在減少數據搬運方面更進(jìn)一步,但其計算能力有限,僅適用于特定場(chǎng)景。
圖5 存內處理示意圖
?、鄞鎯扔嬎?CIM,Computation In Memory):存內計算是存算一體的最終形式,如圖6所示,通過(guò)將復雜計算能力直接集成到存儲單元中,真正實(shí)現了計算與存儲的深度融合。CIM不僅徹底消除了數據搬運,還顯著(zhù)提升了計算密度和能效,適合AI推理、邊緣計算等場(chǎng)景,是未來(lái)高算力需求的理想解決方案。
圖6 存內計算示意圖
二、AI算力需求開(kāi)啟千億級市場(chǎng)
2.1 存算一體技術(shù)發(fā)展歷程
存算一體技術(shù)的發(fā)展歷程可以追溯到20世紀60年代。1969年,斯坦福研究所的研究人員首次提出了存算一體的概念,認為通過(guò)將計算單元和存儲單元深度融合,能夠顯著(zhù)減少數據搬運帶來(lái)的延遲和能耗。然而,由于當時(shí)的硬件技術(shù)限制,這一概念僅停留在理論層面,尚無(wú)法投入實(shí)際應用。在1980年代至2000年代,存算技術(shù)進(jìn)入初步實(shí)踐階段,學(xué)術(shù)界嘗試在DRAM等存儲器中集成簡(jiǎn)單的計算能力(如加法和邏輯運算),開(kāi)創(chuàng )了近存計算(PNM)和存內處理(PIM)的研究方向,但因存儲器本身性能有限、制造成本高,進(jìn)展較為緩慢。
真正推動(dòng)存算技術(shù)進(jìn)入突破階段的是21世紀初新型存儲器技術(shù)的崛起。2008年,憶阻器(ReRAM)的發(fā)明成為存算技術(shù)的重要轉折點(diǎn),這種存儲器不僅可以存儲數據,還能直接執行布爾邏輯運算。2010年,惠普實(shí)驗室成功利用憶阻器完成了簡(jiǎn)單運算的硬件實(shí)驗,驗證了存算一體架構的可行性。此后,磁阻存儲器(MRAM)和相變存儲器(PCM)等新型存儲技術(shù)陸續被引入存算一體的研究中,存算一體技術(shù)逐漸從理論走向實(shí)踐。進(jìn)入2010年代,產(chǎn)業(yè)界開(kāi)始嘗試將存算技術(shù)應用于實(shí)際產(chǎn)品,例如Mythic推出的基于NOR Flash的AI芯片M1108成為早期商用案例。2020年后,存算技術(shù)進(jìn)入商業(yè)化加速階段,特別是在A(yíng)I、大數據和邊緣計算場(chǎng)景中,基于存算一體架構的芯片憑借其高能效和低成本的優(yōu)勢,逐漸成為市場(chǎng)主流。例如,國內的知存科技、昕原半導體等企業(yè)陸續推出面向端側和邊緣計算的存算芯片,推動(dòng)技術(shù)在實(shí)際場(chǎng)景中的廣泛應用。
存算一體技術(shù)的發(fā)展歷程體現了技術(shù)從理論構想到產(chǎn)業(yè)化落地的跨越式進(jìn)步。如今,隨著(zhù)AI模型規模和算力需求的持續增長(cháng),存算一體技術(shù)正以其獨特的架構優(yōu)勢,為突破存儲墻瓶頸和支撐未來(lái)算力需求提供重要解決方案。
圖7 存算一體技術(shù)的發(fā)展歷程
2.2 存算一體技術(shù)的優(yōu)勢
存算一體技術(shù)以其高性?xún)r(jià)比和超低功耗的優(yōu)勢,正逐漸成為AI硬件領(lǐng)域不可忽視的“殺手級”解決方案。如圖8,以Z公司的芯片為例,僅需0.8美元就能實(shí)現50 GOPS的算力,而傳統CPU和GPU實(shí)現同等算力的成本卻分別高達20美元和30美元。更令人驚喜的是,存算一體技術(shù)通過(guò)將計算單元直接集成到存儲單元中,極大地減少了數據搬運,不僅運行功耗低至5uA-3mA,還讓硬件設計更加簡(jiǎn)潔高效。這使其在智能耳機、智能音箱等端側設備中表現尤為出色,既能提升設備AI處理能力,又顯著(zhù)降低成本。此外,存算一體技術(shù)還在快速向邊緣視頻處理和云端AI推理等領(lǐng)域擴展,憑借高效的計算架構為高算力場(chǎng)景提供了更綠色、更高效的解決方案,展現出廣闊的市場(chǎng)前景。
圖8 存算一體技術(shù)的優(yōu)勢
2.3 存算一體技術(shù)的應用場(chǎng)景
從端到云:滿(mǎn)足不同層級的算力需求
存算一體技術(shù)憑借其高能效和靈活性,正在端、邊、云不同層級的計算場(chǎng)景中大展身手。如圖9所示,在端側,智能耳機、語(yǔ)音助手等設備通過(guò)搭載存算一體芯片,能以極低功耗實(shí)現復雜的語(yǔ)音處理和降噪功能,比如一顆2MB的存算芯片可提供100 Gops的算力,同時(shí)顯著(zhù)降低設備成本。在邊緣側,智能汽車(chē)和AR眼鏡等需要實(shí)時(shí)數據處理的場(chǎng)景,則更看重存算一體的高性能和高能效,比如一顆128MB的芯片可以實(shí)現64 Tops的算力,滿(mǎn)足自動(dòng)駕駛中的實(shí)時(shí)感知需求。而在云端,存算一體作為下一代AI芯片的關(guān)鍵技術(shù),憑借其超高算力(如2GB芯片實(shí)現1024 Tops),在數據中心的模型訓練和推理任務(wù)中展現出了綠色高效的潛力。
圖9 存算一體技術(shù)的應用場(chǎng)景
存算一體技術(shù)不僅在架構設計上突破傳統,還為“類(lèi)腦計算”這一未來(lái)方向奠定了基礎。與傳統的計算架構不同,存算一體技術(shù)的矩陣計算模型模擬了大腦神經(jīng)元和突觸之間的連接關(guān)系,這讓它在神經(jīng)網(wǎng)絡(luò )運算中表現出驚人的效率。比如在深度學(xué)習任務(wù)中,存算一體技術(shù)的并行計算能力可以快速處理多層感知和推理任務(wù),這種類(lèi)似人腦的處理方式讓它在智能設備中實(shí)現了更復雜的場(chǎng)景,比如語(yǔ)音識別、圖像處理以及實(shí)時(shí)環(huán)境分析。未來(lái),類(lèi)腦計算與存算一體技術(shù)的結合,將賦能更多智能設備,推動(dòng)從硬件到架構的全新進(jìn)化,讓AI更貼近“智慧”的本質(zhì)。
圖10 類(lèi)腦計算示意圖
2.4 存算一體技術(shù)市場(chǎng)規模:千億級賽道加速崛起
存算一體技術(shù)正隨著(zhù)AI、大數據等高算力需求的快速增長(cháng),成為推動(dòng)半導體市場(chǎng)擴張的重要動(dòng)力。根據數據顯示,到2025年,存算一體小算力芯片市場(chǎng)規模將達到125億元人民幣,遠期市場(chǎng)空間更為廣闊;到2030年,小算力芯片市場(chǎng)規模預計突破1069億元人民幣,而大算力芯片的市場(chǎng)規模也將達到67億元人民幣,兩者合計將推動(dòng)存算一體芯片市場(chǎng)整體規模達到1136億元人民幣。從端、邊、云三層來(lái)看,端側市場(chǎng)的爆發(fā)最為顯著(zhù),其規模從2025年的110億元快速增長(cháng)到2030年的995億元,成為最大的增量來(lái)源。
圖11 2025-2030 存算一體芯片市場(chǎng)規模預測
作為存算一體技術(shù)的核心基礎,存儲器市場(chǎng)同樣在蓬勃發(fā)展。從2019年到2025年,全球存儲器市場(chǎng)預計將從1050億美元增長(cháng)到接近2000億美元,其中DRAM和NAND存儲器雙線(xiàn)增長(cháng)。尤其是NAND存儲器,在智能終端和數據中心需求的驅動(dòng)下,將迎來(lái)更高的市場(chǎng)占比。存儲器技術(shù)的成熟不僅為存算一體技術(shù)提供了可靠的硬件基礎,還推動(dòng)了存算一體芯片在低功耗、高效率計算場(chǎng)景中的快速落地。
圖12 2019-2025年存儲器市場(chǎng)
三、存內計算:打破存儲墻的技術(shù)躍遷之路
從智能終端到邊緣計算,再到云端AI推理,這一技術(shù)正在為不同層級的算力需求提供高效解決方案。而它的核心優(yōu)勢,正是來(lái)源于對傳統計算架構的顛覆性創(chuàng )新——直接在存儲器中實(shí)現計算功能。
與傳統的“近存計算”不同,存內計算更進(jìn)一步,真正實(shí)現了存儲與計算的深度融合。它不僅在市場(chǎng)規模上展現出千億級的增長(cháng)潛力,更在技術(shù)層面提供了多樣化的實(shí)現路徑。接下來(lái),文章將從模擬存內計算與數字存內計算兩大技術(shù)路線(xiàn),以及在不同存儲器中的具體實(shí)現,來(lái)全面探討這一技術(shù)如何打破存儲墻,為未來(lái)算力升級奠定基礎。
3.1 存內計算的兩大技術(shù)路線(xiàn)
模擬存內計算:利用物理規律實(shí)現高效計算
模擬存內計算通過(guò)直接利用物理規律(歐姆定律和基爾霍夫定律)在存儲陣列中完成運算,具有高能效和并行計算能力。以圖13中的RRAM(阻變存儲器)存內計算矩陣為例,每個(gè)存儲單元的導電性(Gij)表示權重參數,輸入向量 [v1,v2,v3]轉化為電壓信號施加到橫向電壓線(xiàn)(Word Line)上,產(chǎn)生與導電性和輸入電壓成正比的電流。通過(guò)列方向(Bit Line)的電流累加,實(shí)現矩陣-向量乘法,例如 I1=∑jG1jVj ,即完成了數據的加權和。這種直接利用電流、電壓關(guān)系進(jìn)行計算的方法,無(wú)需數據搬運,能效極高,尤其適合大規模矩陣運算。
圖13 基于RRAM的模擬存內計算陣列
然而,模擬存內計算也面臨一些限制,例如計算精度受信號非線(xiàn)性和噪聲的影響,較難應用于高精度場(chǎng)景。盡管如此,其低功耗和高并行特性使其在物聯(lián)網(wǎng)傳感器、可穿戴設備等對功耗敏感的場(chǎng)景中大放異彩,為終端AI應用提供了一種高效的解決方案。
數字存內計算:高精度計算的實(shí)現路徑
數字存內計算通過(guò)在存儲陣列內部集成邏輯運算單元(如與門(mén)、加法器等),將計算功能嵌入存儲單元,從而實(shí)現存儲與計算的深度融合。圖14展示了基于SRAM的數字存內計算架構,其核心是“數字加法樹(shù)”(Digital Add Tree)。在這一架構中,輸入向量 [IN1,IN2,…,INn]被加載到讀取字線(xiàn)(Read Word Line, RWL)上,與存儲的權重參數 [W1,W2,…,Wn]逐位相乘。每個(gè)存儲單元通過(guò)簡(jiǎn)單的乘法器完成加權操作,然后將結果輸入數字加法樹(shù),層層累加,最終輸出向量點(diǎn)積結果。
圖14 基于SRAM的數字存內計算加法樹(shù)
相比模擬存內計算,數字存內計算具有更高的計算精度,能夠避免模擬信號帶來(lái)的非線(xiàn)性誤差和噪聲干擾。然而,其硬件實(shí)現相對復雜,邏輯電路的加入增加了存儲單元的面積和功耗,這使其更適合對精度要求較高且功耗不敏感的場(chǎng)景,例如云端AI推理和科學(xué)計算。
數字存內計算通過(guò)邏輯電路和數字信號的精確運算,為實(shí)現高精度矩陣運算提供了一種可靠的硬件方案。這種技術(shù)在推動(dòng)存算一體化發(fā)展、突破存儲墻瓶頸方面具有重要意義,為未來(lái)云計算和高性能計算奠定了技術(shù)基礎。
3.2 不同存儲技術(shù)中存內計算的實(shí)現
在了解了模擬存內計算與數字存內計算這兩大技術(shù)路線(xiàn)后,我們不禁好奇,它們是如何在具體存儲器中得以實(shí)現的?不同存儲技術(shù)的物理特性決定了其在存內計算中的具體應用方式和優(yōu)勢。
經(jīng)典存儲器的存算實(shí)現
在存算一體技術(shù)的發(fā)展中,NAND Flash 作為經(jīng)典存儲器的重要代表,通過(guò)其獨特的存儲單元結構和工作原理,實(shí)現了存儲與計算的深度融合。如圖15所示,NAND Flash 的存儲單元由浮柵結構組成,其關(guān)鍵組件包括控制柵、浮柵、絕緣介質(zhì)層和隧穿氧化層。通過(guò)調整電壓,使電子在浮柵和襯底之間的隧穿效應發(fā)生變化,從而改變存儲單元的閾值電壓。這種特性不僅用于存儲“0”和“1”狀態(tài),還可以擴展為多級存儲,用于存儲更高密度的數據。
圖15 NAND Flash結構示意圖
在存算一體化中,NAND Flash 利用浮柵的多閾值特性,通過(guò)精確控制電壓對數據進(jìn)行簡(jiǎn)單計算。例如,在讀取數據時(shí),存儲單元的電流變化能夠被感知,從而完成加權累加等操作。這種基于物理特性的計算方法,不僅減少了數據搬運的能耗,還提升了大規模并行計算的效率。
然而,NAND Flash 在存算實(shí)現中也面臨可靠性和壽命的挑戰,例如隧穿氧化層的薄化可能導致電子泄漏和數據穩定性下降。通過(guò)3D NAND 技術(shù)的堆疊和優(yōu)化,其存儲密度與性能得到了進(jìn)一步提升,為智能終端和邊緣計算等領(lǐng)域提供了高效的解決方案。NAND Flash 的結構與工作原理,是經(jīng)典存儲器存算實(shí)現的典型代表,也是未來(lái)存算一體技術(shù)的重要基石。
新型存儲器的存算實(shí)現
1、阻變存儲器(ReRAM)
阻變存儲器(ReRAM)是一種基于電阻變化的非易失性存儲技術(shù),通過(guò)改變量子薄膜材料的電阻狀態(tài)來(lái)實(shí)現數據存儲。如圖16所示,其基本結構采用金屬-絕緣層-金屬(MIM)的三明治式設計,由上電極、阻變層和下電極組成。其中,阻變層是關(guān)鍵部分,通過(guò)施加電壓形成或斷開(kāi)導電通道(導電細絲),切換高電阻狀態(tài)(HRS)和低電阻狀態(tài)(LRS),分別對應邏輯“0”和“1”。
圖16 ReRAM結構示意圖
在存算一體中,ReRAM 利用其高低電阻狀態(tài)直接完成簡(jiǎn)單邏輯運算和加權累加操作,無(wú)需額外的計算單元。這種結構簡(jiǎn)單、能耗低且讀寫(xiě)速度快,非常適合高密度存儲和邊緣計算場(chǎng)景。然而,ReRAM 仍面臨導電細絲穩定性和制造一致性的挑戰,需進(jìn)一步優(yōu)化以實(shí)現大規模應用。作為新型存儲器的代表,ReRAM 為存算一體的技術(shù)突破提供了新的路徑。
2、磁性隨機存儲器MRAM
磁性隨機存儲器(MRAM)是一種基于磁性隧道結(MTJ)的非易失性存儲技術(shù),通過(guò)磁化方向的變化實(shí)現數據存儲。如圖17,其結構由固定層、自由層和隧道層組成,其中固定層的磁化方向保持不變,自由層的磁化方向可以在外加電流或電場(chǎng)的作用下翻轉。隧道層位于兩層之間,通過(guò)量子隧穿效應傳輸電流。
圖17 MRAM結構示意圖
MRAM 的工作原理是利用自由層和固定層磁化方向的相對狀態(tài)決定電阻值:當兩層磁化方向平行時(shí),電阻較低(低阻狀態(tài),表示“0”);當磁化方向反平行時(shí),電阻較高(高阻狀態(tài),表示“1”)。這一特性使 MRAM 不僅具有非易失性,還具備高讀寫(xiě)速度和無(wú)限擦寫(xiě)耐久性的優(yōu)點(diǎn),是存算一體技術(shù)的潛在硬件實(shí)現之一。
3、相變存儲器PCM
相變存儲器(PCM)利用材料的相變特性,通過(guò)改變存儲介質(zhì)(如鍺銻碲合金,GST)的物理狀態(tài)來(lái)實(shí)現數據存儲。如圖18,其核心結構由上電極、下電極、加熱電阻層和相變材料層組成。相變材料可以在晶態(tài)(低電阻)和非晶態(tài)(高電阻)之間切換,分別對應邏輯“1”和“0”。
圖18 PCM結構示意圖
PCM 的工作原理基于熱控制:通過(guò)加熱電阻調節溫度,快速冷卻使材料保持非晶態(tài)(高電阻),緩慢冷卻則使其結晶形成晶態(tài)(低電阻)。這一特性不僅能實(shí)現數據存儲,還能直接進(jìn)行簡(jiǎn)單的邏輯運算,為存算一體提供硬件支持。PCM 具備非易失性、高速度和高存儲密度等優(yōu)勢,但由于寫(xiě)入過(guò)程中的功耗較高,目前主要應用于高性能存儲和嵌入式設備中。
存算一體技術(shù)的實(shí)現路徑,既包含了經(jīng)典存儲器的突破,也融入了新型存儲器的創(chuàng )新。從 NAND Flash 到 ReRAM、MRAM、PCM,每一種存儲技術(shù)都展現了獨特的魅力。
在經(jīng)典存儲器中,NAND Flash 憑借成熟的技術(shù)和高存儲密度,通過(guò)浮柵技術(shù)實(shí)現了存儲與計算的初步結合。這種技術(shù)既解決了大規模數據處理的效率問(wèn)題,也為存算一體技術(shù)奠定了基礎。然而,隨著(zhù)需求的多樣化和技術(shù)發(fā)展的瓶頸,NAND Flash 的局限性也愈發(fā)顯現。
新型存儲器的出現,為存算一體技術(shù)注入了更多活力。ReRAM 以其高低電阻的切換,實(shí)現了簡(jiǎn)單邏輯運算和數據存儲的雙重功能;MRAM 通過(guò)磁性隧道結,提供了快速讀寫(xiě)與高耐久性的解決方案;而 PCM 則利用材料的相變特性,在數據存儲和邏輯計算中表現優(yōu)異。它們不僅各自為存算一體的實(shí)現提供了可能,更在存儲密度、速度、功耗等方面進(jìn)一步拓寬了技術(shù)邊界。
總結來(lái)看,無(wú)論是經(jīng)典存儲器還是新型存儲器,它們共同推動(dòng)了存算一體技術(shù)的發(fā)展,打破了傳統計算架構中“存儲墻”的限制。在未來(lái),這些技術(shù)將進(jìn)一步融合,為我們帶來(lái)更高效、更智能的計算與存儲解決方案。存算一體,不僅是一場(chǎng)技術(shù)革命,更是一場(chǎng)賦能未來(lái)的進(jìn)化之路。
四、本土發(fā)展與海外齊頭并進(jìn):存算一體技術(shù)的全球競速
在存算一體技術(shù)的賽道上,全球產(chǎn)業(yè)格局正在快速演變,呈現出“本土崛起、海外領(lǐng)先”的雙軌并行趨勢。海外的技術(shù)巨頭憑借成熟的技術(shù)積累和完善的產(chǎn)業(yè)鏈,依然在市場(chǎng)中占據優(yōu)勢;與此同時(shí),本土企業(yè)通過(guò)技術(shù)突破和資本加持,正奮力追趕,實(shí)現了從跟隨到部分領(lǐng)域引領(lǐng)的跨越。
4.1海外布局:巨頭穩固,創(chuàng )新涌現
海外市場(chǎng),三星、SK海力士等巨頭在 NAND Flash、ReRAM 等傳統存儲技術(shù)上依舊占據核心地位,其強大的 IDM(集成制造)和 Fab(代工制造)模式為高效存儲和計算一體化提供了堅實(shí)基礎。同時(shí),Crossbar、Mythic 等新興企業(yè)聚焦 ReRAM 和 MRAM 等前沿領(lǐng)域,推動(dòng)了存算一體技術(shù)在高性能計算和邊緣設備中的應用。
值得注意的是,海外企業(yè)不僅擁有技術(shù)深度,還在產(chǎn)業(yè)鏈整合和商業(yè)化落地上展現了強大實(shí)力。三星在 NAND Flash 技術(shù)的堆疊工藝中屢創(chuàng )新高,成為存儲密度提升的全球標桿,而 IBM 等企業(yè)則積極布局 MRAM 技術(shù),用于未來(lái)人工智能計算需求。
4.2本土崛起:多點(diǎn)開(kāi)花,彎道超車(chē)
在存算一體技術(shù)的本土化進(jìn)程中,傳統巨頭與新興力量共同推動(dòng)了國產(chǎn)存儲產(chǎn)業(yè)的快速發(fā)展。作為全球領(lǐng)先的芯片代工企業(yè),臺積電憑借其在 Flash 和 SRAM 制程領(lǐng)域的深厚積累,為國內存儲技術(shù)提供了強大的制造支持。臺積電的先進(jìn)制程技術(shù),不僅讓國產(chǎn)存儲器在全球市場(chǎng)中站穩腳跟,也為國內企業(yè)從研發(fā)到量產(chǎn)的跨越奠定了堅實(shí)基礎。在 3D NAND Flash 和高性能 SRAM 制程上,臺積電的技術(shù)領(lǐng)先性依然是本土企業(yè)追趕國際巨頭的重要依托。
與此同時(shí),新興企業(yè)的崛起為本土產(chǎn)業(yè)注入了新的活力。上海昕原半導體專(zhuān)注于 ReRAM 技術(shù)研發(fā),是中國大陸首家實(shí)現先進(jìn)制程 ReRAM 量產(chǎn)的企業(yè),其自建的 12 寸中試生產(chǎn)線(xiàn)順利通線(xiàn),標志著(zhù)國內在新型存儲器技術(shù)領(lǐng)域的重大突破。昕原的 ReRAM 產(chǎn)品,不僅覆蓋終端與邊緣計算場(chǎng)景,還展現出在 AI 芯片領(lǐng)域的潛力,體現了技術(shù)突破與商業(yè)化落地的高度結合。與之并行的杭州知存科技則聚焦 Flash 存儲器的創(chuàng )新應用,通過(guò)推出 WTM 系列存算芯片,在端、邊、云等多場(chǎng)景應用中占據一席之地,并開(kāi)始布局 MRAM 等新型存儲技術(shù),為未來(lái)高性能存儲提供了更多可能。
本土存儲產(chǎn)業(yè)的崛起,是傳統巨頭與新興勢力協(xié)同共進(jìn)的結果。尤其上海昕原和杭州知存的快速突破,則為國產(chǎn)存儲器在細分領(lǐng)域的全球競爭中提供了更多優(yōu)勢。在傳統與創(chuàng )新的雙輪驅動(dòng)下,本土存算一體技術(shù)正以多點(diǎn)開(kāi)花的態(tài)勢,向國際市場(chǎng)發(fā)起強有力的沖擊。
圖19 存算一體技術(shù)國內外競爭格局
4.3國內初創(chuàng )企業(yè)概覽:存算一體領(lǐng)域的投資機會(huì )
近年來(lái),國內存算一體領(lǐng)域的初創(chuàng )企業(yè)如雨后春筍般崛起,在技術(shù)創(chuàng )新與市場(chǎng)布局方面展現出強勁勢頭。從傳統的 Flash 到新興的 ReRAM、MRAM,各類(lèi)存儲器技術(shù)百花齊放,覆蓋了從終端到邊緣再到云端的廣泛應用場(chǎng)景。知存科技依托 Flash 技術(shù),在端、邊、云多場(chǎng)景中實(shí)現了產(chǎn)品落地,估值已突破 29 億元;而昕原半導體專(zhuān)注于 ReRAM 技術(shù),率先實(shí)現了 28nm 工藝量產(chǎn),產(chǎn)品良率高達 85%,目前估值已超 30 億元。此外,后摩智能則在 SRAM 與 ReRAM 結合上開(kāi)辟新路徑,其 H30 芯片量產(chǎn)標志著(zhù)國產(chǎn)存算一體技術(shù)邁入新階段。這些企業(yè)在細分領(lǐng)域的深耕,不僅展現了技術(shù)創(chuàng )新的活力,也凸顯了多樣化的投資潛力。
從資本市場(chǎng)的表現來(lái)看,存算一體技術(shù)正成為新的投資熱土。這些初創(chuàng )企業(yè)的高估值和融資熱度表明,市場(chǎng)對存算一體技術(shù)未來(lái)的發(fā)展充滿(mǎn)期待。知存科技、昕原半導體等企業(yè)的成功,不僅驗證了新型存儲技術(shù)的市場(chǎng)價(jià)值,也為資本找到了一條聚焦高技術(shù)含量領(lǐng)域的投資路徑。對于投資者而言,存算一體領(lǐng)域正處于技術(shù)突破與規?;瘧玫慕粎R點(diǎn),捕捉其中的機會(huì ),將是布局未來(lái)科技產(chǎn)業(yè)的重要一步。
圖20 國內存算一體投資機會(huì )概覽
五、城市級投資機會(huì )
全球存算一體技術(shù)的競速已經(jīng)進(jìn)入白熱化階段,海外巨頭憑借技術(shù)積累和產(chǎn)業(yè)鏈優(yōu)勢保持領(lǐng)先,而本土企業(yè)則通過(guò)創(chuàng )新突破和資本加持不斷縮小差距。在這場(chǎng)科技競速中,區域發(fā)展逐漸成為關(guān)鍵推動(dòng)力——從科研突破到產(chǎn)業(yè)集群,各地紛紛憑借技術(shù)、人才和政策優(yōu)勢塑造獨特的存儲生態(tài)。接下來(lái),本節將聚焦區域化發(fā)展背后的城市級投資機會(huì ),探討它們如何為存算一體技術(shù)的產(chǎn)業(yè)化落地注入強勁動(dòng)力。
5.1科研突破:存算一體的新動(dòng)力
近年來(lái),國內高校在存算一體領(lǐng)域的科研表現可謂亮眼。如圖21所示,從清華大學(xué)的憶阻器存算一體芯片,到中科院提出的SRAM存算方案,再到南京大學(xué)的高能效存儲器技術(shù),各大高校不斷刷新著(zhù)這一領(lǐng)域的技術(shù)高度。這些研究不僅停留在理論階段,已經(jīng)逐步展現出從實(shí)驗室走向實(shí)際應用的潛力。
更值得關(guān)注的是,這些技術(shù)背后蘊藏的商業(yè)機會(huì )。比如,憶阻器存算方案的突破性進(jìn)展,為人工智能芯片優(yōu)化提供了新路徑;而高能效存儲器的開(kāi)發(fā),則為邊緣計算和低功耗設備奠定了技術(shù)基礎。這些高校的研究成果不僅指明了技術(shù)發(fā)展的方向,也為市場(chǎng)帶來(lái)了潛在的投資機會(huì )。存算一體技術(shù),將成為下一個(gè)產(chǎn)業(yè)風(fēng)口。
圖21 國內科研存算一體領(lǐng)域進(jìn)展一覽
5.2 存儲高地:城市崛起的創(chuàng )新力量
近年來(lái),存算一體技術(shù)的區域化發(fā)展正在加速,北京、上海、杭州、南京、合肥等城市逐漸成為存儲產(chǎn)業(yè)的重要高地。依托頂尖高校的科研實(shí)力和本地企業(yè)的技術(shù)落地能力,這些地區在存儲技術(shù)創(chuàng )新與應用上齊頭并進(jìn)。
北京以清華大學(xué)和北京大學(xué)為科研核心,不斷輸出前沿成果并轉化為產(chǎn)業(yè)優(yōu)勢;杭州的知存科技和合肥的??莆⒃贔lash與ReRAM領(lǐng)域表現亮眼,為存算一體技術(shù)的實(shí)際應用開(kāi)辟新路徑;南京的后摩智能和上海的昕原半導體專(zhuān)注于SRAM與ReRAM技術(shù),通過(guò)技術(shù)突破推動(dòng)邊緣計算與AI場(chǎng)景的落地。
這些城市不僅是技術(shù)創(chuàng )新的熱土,也為未來(lái)存儲產(chǎn)業(yè)的規?;l(fā)展注入了持續動(dòng)能??蒲信c產(chǎn)業(yè)的結合正加速產(chǎn)學(xué)研一體化,為中國存儲技術(shù)崛起創(chuàng )造了前所未有的機遇。
可以看到,各大城市正通過(guò)科研資源整合、技術(shù)創(chuàng )新與產(chǎn)業(yè)政策支持,推動(dòng)存算一體技術(shù)從實(shí)驗室走向市場(chǎng)。從端側到云端,從高校實(shí)驗室到產(chǎn)業(yè)集群,區域化發(fā)展已成為這一技術(shù)突破的重要引擎。未來(lái),隨著(zhù)區域間協(xié)同創(chuàng )新的加速,中國或將憑借其獨特的產(chǎn)業(yè)生態(tài),在全球存算一體技術(shù)的競爭中占據更重要的席位,為計算架構的革命性發(fā)展注入新的動(dòng)力。
六、投資邏輯與投資機會(huì )
區域創(chuàng )新的快速發(fā)展為存算一體技術(shù)的落地提供了肥沃的土壤,而這些技術(shù)突破也為投資者帶來(lái)了前所未有的機遇。從科研到產(chǎn)業(yè)化,存算一體領(lǐng)域正進(jìn)入價(jià)值釋放的關(guān)鍵時(shí)期。本節將從投資邏輯出發(fā),剖析這一領(lǐng)域的潛力與方向,為布局未來(lái)科技產(chǎn)業(yè)提供思路。
6.1投資邏輯
存算一體技術(shù)作為后摩爾時(shí)代的全新計算架構,正在顛覆傳統的存儲和計算分離模式,其變革意義不亞于一次科技革命。隨著(zhù)摩爾定律逐漸逼近極限,傳統芯片計算能力的提升開(kāi)始放緩,而存算一體技術(shù)通過(guò)突破“存儲墻”這一瓶頸,成為未來(lái)計算發(fā)展的必然選擇。特別是在人工智能、大數據等需要高效算力的領(lǐng)域,這一技術(shù)能夠通過(guò)將計算能力融入存儲單元,顯著(zhù)提升效率、降低成本,展現出極大的市場(chǎng)吸引力。
從市場(chǎng)潛力來(lái)看,存算一體技術(shù)的應用場(chǎng)景十分廣闊,涵蓋端側設備、邊緣計算和云計算等領(lǐng)域,預計到2030年相關(guān)市場(chǎng)規模有望達到千億量級。這種成長(cháng)性不僅體現出對科技產(chǎn)業(yè)的革命性推動(dòng)作用,也為投資者提供了長(cháng)期價(jià)值的保障。而國內在該技術(shù)領(lǐng)域與國際差距相對較小,更具備“彎道超車(chē)”的可能性,是實(shí)現科技自主可控的重要突破口??梢哉f(shuō),存算一體技術(shù)承載了未來(lái)產(chǎn)業(yè)升級的希望,也成為投資邏輯中的核心支柱。
6.2投資機會(huì )
目前,存算一體技術(shù)正處于產(chǎn)業(yè)化初期,技術(shù)和工藝的成熟尚需時(shí)間,但這恰恰是投資的窗口期。國內企業(yè)在這一領(lǐng)域表現出了強大的研發(fā)潛力和靈活的市場(chǎng)響應能力,尤其是在制造工藝、算法優(yōu)化等關(guān)鍵環(huán)節,已經(jīng)初步展現出核心競爭力。選擇有能力提升工藝水平、攻克制造瓶頸的企業(yè),將是發(fā)掘未來(lái)獨角獸企業(yè)的關(guān)鍵所在。
此外,存算一體技術(shù)的價(jià)值還體現在它能夠滿(mǎn)足端、邊、云等多層次市場(chǎng)需求,從消費端到數據中心,均有廣泛應用潛力。特別是在端側和邊緣計算市場(chǎng)中,一些具備前沿技術(shù)儲備的企業(yè),已經(jīng)開(kāi)始小批量生產(chǎn)并實(shí)現客戶(hù)導入。這樣的企業(yè)不僅能帶來(lái)短期業(yè)績(jì)增長(cháng),還將在未來(lái)幾年內實(shí)現爆發(fā)式發(fā)展,為投資者創(chuàng )造超額回報。對于追求創(chuàng )新與回報平衡的投資者來(lái)說(shuō),存算一體無(wú)疑是一個(gè)值得長(cháng)期布局的領(lǐng)域。
結語(yǔ):打破存儲墻,賦能智慧未來(lái)
從馮·諾依曼架構的輝煌與局限,到存算一體技術(shù)的橫空出世,我們正處在計算架構變革的前沿。存算一體技術(shù)不僅打破了“存儲墻”這一長(cháng)期制約算力發(fā)展的瓶頸,更為人工智能、大數據等領(lǐng)域注入了新動(dòng)能。從智能耳機到自動(dòng)駕駛,從邊緣計算到云端推理,這項技術(shù)正悄然改變我們的日常生活。
全球范圍內,各大科技巨頭和初創(chuàng )企業(yè)在存算一體技術(shù)上展開(kāi)激烈角逐,而中國本土產(chǎn)業(yè)也通過(guò)技術(shù)突破和區域協(xié)同,逐步縮小差距,甚至在某些細分領(lǐng)域實(shí)現超越??蒲袑?shí)力、資本支持與產(chǎn)業(yè)化落地的深度結合,為中國在這一領(lǐng)域贏(yíng)得更多主動(dòng)權提供了堅實(shí)基礎。
未來(lái),存算一體技術(shù)不僅是推動(dòng)科技創(chuàng )新的核心力量,更可能成為智能時(shí)代發(fā)展的重要引擎。無(wú)論是千億級市場(chǎng)的擴展,還是產(chǎn)業(yè)鏈的全面升級,存算一體都將書(shū)寫(xiě)計算架構的新篇章。我們站在歷史的交匯點(diǎn)上,見(jiàn)證著(zhù)技術(shù)的飛躍,也迎來(lái)了全新的發(fā)展機遇。在這場(chǎng)通向智慧未來(lái)的旅程中,存算一體技術(shù),正在為我們打開(kāi)無(wú)限可能的大門(mén)。
*參考文獻
[1]中國移動(dòng)研究院. (2022). 存算一體白皮書(shū) [R].
[2]中國信息通信技術(shù)研究院. (2021). 中國算力發(fā)展指數白皮書(shū) [R].
[3]林鈺登. (2019). 基于新型憶阻器的存內計算. 微納電子與智能制造.
[4]尹勛釗. (2022). 存算一體電路與跨層次協(xié)同設計優(yōu)化:從SRAM到鐵電晶體管. 中國科學(xué).
[5]丁士鵬. (2021). 基于NOR Flash的存算一體模擬乘加電路設計. 信息技術(shù)與網(wǎng)絡(luò )安全.
[6]冒偉, 劉景寧, 等. (2015). 基于相變存儲器的存儲技術(shù)研究綜述. 計算機學(xué)報.
[7]Amir Gholami. (2022). AI and Memory Wall [Online]. Retrieved from https://medium.com/riselab/ai-and-memory-wall-2cb4265cb0b8
[8]Tanachutiwat, S., Ming, L., & Wei, W. (n.d.). FPGA Based on Integration of CMOS and RRAM [M].
[9]Tehrani, S., Engel, B., Chen, E., et al. (2000). Recent developments in magnetic tunnel junction MRAM. In IEEE International Magnetics Conference (pp. xx-xx). IEEE.
來(lái)源:投資五部 許希文
審核:薛瑤
發(fā)布:尤異
相關(guān)附件