文丨謝怡靜 盧瀅西
編|張藝
俄烏衝突下,甲骨文、SAP等科技企業紛紛停止在俄羅斯的業務,這再次引爆“去IOE”(指IBM的小型機、Oracle的數據庫、EMC的存儲)的話題。國際形勢波譎雲詭,隻有自力更生,將底層基礎科技能力夯實纔能避免“卡脖子”。
數據庫作為智能時代的基礎設施之一,國産替代需求也正在爆發。
人工智能、雲計算等技術逐步落地,導緻數據量規模呈指數級增長,數據的存儲和應用就麵臨著更大的機遇和挑戰。
一方麵,隨著政策利好,數字化轉型大潮,以及市場教育逐漸成熟,國內企業的IT支齣提升,數字庫行業迎來發展機遇。
據中國信通院測算,2020年中國數據庫市場規模約241億元。預計到2025年,中國數據庫市場規模將達688億元,年復閤增長率為23.4%。然而,2020年我國數據庫市場規模在國內IT支齣占比約0.9%,而全球這一比例則達1.9%。兩組數據都錶明,我國數據庫市場增長潛力巨大。
另一方麵,目前海外巨頭仍占據國內市場的主要份額,如,2020年國外廠商占據我國數據庫市場80%以上份額。但是,隨著雲化和國産替代趨勢下,國産數據庫在未來將釋放很大的市場空間。
那麼,在外企包圍下,國産數據庫如何逆勢發起突圍?有哪些彎道超車的機會?
3月19日,光錐智能聯閤Scale Partners勢乘資本,與騰訊雲數據庫副總經理王義成、偶數科技CEO常雷、Kyligence閤夥人兼副總裁李棟、歐若數網NebulaGraph CEO葉小萌、紅點中國閤夥人劉嵐、建信(北京)投資高級投資經理等行業一綫的前行者,對於“國産數據庫的突圍”進行瞭深入探討。
國産數據庫的機會
1、國産數據庫市場的現狀
騰訊雲數據庫副總經理王義成:
從市場的角度看,整個大環境令數據庫的自主可控成為大趨勢。據不完全的數據統計,目前國産數據庫廠商有200多傢。這些廠商大緻分為四大類:
第一類,雲廠商。如:騰訊雲,阿裏雲,華為雲等雲廠商下場做數據庫。
第二類,傳統數據庫。如:南大通用,達夢,金倉、漢高、優選等。這類企業的商業模式更多license(授權許可)模式和軟件售賣模式。
第三類,新興數據庫廠商。如:PingCAP 的TiDB,它是從HTAP場景切入。
第四類,換道廠商。一類企業如:恩墨、海量等,他們從做服務轉到做數據庫。還有一類企業如亞信和中興,他們之前從某一行業內做行業應用,換到瞭數據庫的賽道。
國産數據庫的機會很好,但是廠商過多導緻市場很捲,對於客戶來說也會齣現難以選擇廠商的問題。這個市場需要一次大浪淘沙,市場寡頭齣現後將進入更閤理、更穩定的狀態。5~10年的時間,經過市場競爭後,會逐漸齣現名次排序。
紅點中國閤夥人劉嵐:
2015年左右,我們開始投資數據庫領域,當時還沒有太多國産的概念。2020年,因為國際局勢變化以及國內政策的支持,更多創業者進入這個賽道,也有更多資本願意投資。
不過,目前這個賽道已經有點超共識。
一個非常早期的團隊,大廠齣身並具備一定的經驗,資本市場給的估值相對較高。但這個賽道是長周期的。數據庫是基礎軟件産品,從第一行代碼開發,到第一個版本推齣,到第一個客戶落地,第一個商業場景的落地,至少需要三年時間。但從資本角度來看,都期望今天投的這傢公司,明天就産生收入——這違背瞭企業的發展周期。
希望資金入場後要有耐心,也希望賽道在大浪淘沙後,能真正跑齣來自主可控,與國際玩傢一較高下的企業。可能金融的部分場景,特彆是事務型的數據庫,目前還是離不開全球排名前五的數據庫廠商,但是,未來希望國內不管是創業者還是大廠都可以逐漸占領這塊市場。
偶數科技CEO常雷:
中國的數據庫市場規模基本上占到全球十分之一左右,但全球市場中,國外廠商占據主導地位。國內現在很多核心應用場景,如交易場景、分析場景等基本上也是用的國外數據庫,這其實是卡脖子的狀態。
不過,最近幾年國內廠商百花齊放,正在崛起。但也是魚龍混雜,客戶在選擇時需要注意以下幾點:
1)認準技術的潮流和趨勢。如雲化是很大的趨勢,不要選擇一些過時的技術;
2)産品的成熟度。市場上的産品有很多,是否核心自研很重要。現在開源很熱潮,但如果隻是拿著開源進行加工包裝再形成的産品,容易形成很多問題,比如:後續的支持和修復很難跟的上。
3)數據庫的開源和閉源本質區彆不大。用戶會關注,但是並沒有那麼重要。
建信(北京)投資 高級投資經理 硃明陽:
國産化還有很長的路要走,在産品性能、生態建設、服務體係的構建上還有提升空間。同時,國産機會也很大,國産替代醞釀齣的存量市場,還有國産數據庫份額占比提升所帶來的增量市場,會給廠商帶來機遇。而且在國際環境變化下,國産替代有加快的趨勢。
迴到行業本身,數據庫的技術分叉有很多,不同的技術路綫對應不同的場景,我們總體感覺市場是比較割裂的。數據庫市場規模約三四百億元,每年的增速維持在20%。但細分市場規模大部分在幾十億,比如確定性很高的信創市場又能細分為政務信創和行業信創。場景對技術的要求不一樣,適閤的産品也不一樣,每個市場有細分的技術路綫,但每個市場的機會也就是幾十億的規模。
細分技術路綫都需要一定投入,所以想在所有領域追趕國際廠商,可能不太現實。
做好市場定位,找準細分市場,找準優勢,對於第三方獨立廠商來說很重要。 我們會關注這樣的企業:市場定位清晰,有行業資源的積纍,産品自主可控,源代碼自己寫,資質齊全,生態打通,服務支撐體係健全,有代錶性的案例。
2,國産數據庫崛起的機遇
騰訊雲數據庫副總經理王義成:
Oracle的市場有多大,國産數據庫的機會就有多大。國産數據庫的未來主要就是“去O”。中國數據庫市場“去O”大概分成三大階段。
第一階段,優秀的互聯網廠商幾乎都沒有把自己核心命脈或核心業務請求放在Oracle之上。從BAT到第二代、第三代互聯網企業,如京東、美團、滴滴、叮咚買菜等企業都沒有選擇Oracle來支撐主要業務。
第二階段,正在“去O進行時”。很多政府、金融、民生類業務,如互聯網銀行微眾等,也沒有選擇用Oracle去支撐。一部分先行的企業已經開始做新興業務,他們選擇雲數據庫廠商提供的服務,或者一些初創企業的服務,這也是國産數據庫的機會。
第三階段,則是在商業數據庫的深水區“去O”。傳統八大行業的數據庫替換是比較難的,如金融、交通、能源等與傳統數據庫綁定。這個階段是否能實現國産替代,需要廠商與甲方一起把傳統業務最核心的部分拿下,這是未來的機遇。
偶數科技CEO常雷:
數據庫市場增量有兩個機會。
一是上雲趨勢很明顯。此前很多企業都在雲下,現在“雲上”成為彎道超車的機會。
二是傳統國産替代,不要隻盯著交易型,其實分析型場景也是一個有巨大增量機會的市場。許多傳統行業,目前數據依然沒有被很好地開發和利用,但他們這方麵需求正在爆發。在這個領域,大傢漸漸不會再采用傳統的Oracle,所以有海量的新機遇。
建信(北京)投資高級投資經理 硃明陽:
目前市場有幾個趨勢:
一是雲化。新架構意味著新機會,尤其是現在整個互聯網行業趨勢在下行,對成本的控製也比較強烈。一些傳統企業也在接受非核心數據上雲。雲化趨勢中,一些大的廠商優勢相對較大。
二是信創。目前,信創的滲透率不高,大約10%。這意味著,從內網到外網的替換機會比較大。
三是核心業務係統替換。金融行業、運營商行業等核心業務係統的替換,是一個漫長的過程,需要甲方有決心跟耐心去接受國産係統。
四是分析型市場。分析型市場雖然說在國內目前占比不是很高,但隨著數據量的增加,以及數據模型、數據類型的湧現,分析型市場也在不斷被激發。
紅點中國閤夥人劉嵐:
雲計算興起,隨著數據處理,數據站等變化,帶來瞭一些新興的需求和機會。
從早期投資人的角度來看,我們觀察的還是數據領域,技術和需求再往下演進需要什麼?比如,兩年前,疫情剛剛爆發,我投資瞭歐若數網(Nebula Graph),當時看到的機會就是圖數據庫的市場需求激增。2020年 Gartner報告顯示,每個細分領域都有全球數據庫管理係統(DBMS)的增量,其中大部分增長在10%內,隻有圖數據庫是20%左右。
過去一年到現在,我們也在持續思考,比如,雲原生後,所有的IT基礎設施上雲以後,會發生什麼樣的變化,大傢需要是什麼。
中國整個IT基礎設施的演進和美國非常類似,可能中國會比美國晚五至十年,但中國的增速非常快。其中,最大的機會來自金融行業。下一代的分析型數倉架構,正嚮“湖倉一體”變化。“湖倉一體”帶來的其實就是傳統IT變化,整個數據的抽取和清洗的變化。一些新需求,帶來新機會。
3,作為雲廠商,騰訊雲數據庫是如何整體布局的?
騰訊雲數據庫副總經理王義成:
騰訊雲主要是從産品角度打動客戶。
第一個布局點是整個公司層麵的投入。首先,騰訊數據庫團隊有近1000人的研發團隊,而且騰訊對於數據庫的投入還在逐漸加大。數據庫和騰訊會議也在騰訊公司2021年Q3財報中被重點提及,從公司層麵也非常重視。
第二個布局點是騰訊的數據庫在集團內部有長期實戰積纍。我們的團隊從2002年成立,對內支撐瞭財付通、騰訊會議、騰訊視頻、微信支付等海量業務。
然後,騰訊數據庫開始從內部走嚮外部公有雲,如騰訊投資的公司,包括拼多多、美團、每日優鮮等。最後,再走到綫下形成輸齣,去服務運營商、保險、銀行等。
如今,市場上數據庫玩傢眾多,誰能在大浪淘沙中活到最後?
我覺得要解決兩點,一是解決交付成本,二是解決獲客成本。 在獲客成本領域,微信的小程序可以實現用代碼方式直接幫助用戶拉起底層數據庫,騰訊雲可以將獲客成本降到足夠低。此外,騰訊雲擁有大量公有雲客戶,可以做産品驗證,不斷的進行産品更新和測試。解決交付成本核心在於建設數據庫生態,很多轉型做數據庫的優秀服務商都在擁抱騰訊生態。
産品的核心力建設、公司的持續投入、多雲的部署模式,其實都是要解決的交付成本和獲客成本。
4,紅點在大數據領域的投資邏輯
紅點中國閤夥人劉嵐:
紅點中國專注投早期,持續關注的是技術驅動下的新需求變化,同時也對技術提齣瞭新的要求。2014年,我們在美國投資瞭Snowflake的B輪,當時就是看到瞭市場上有雲原生的數倉需求,而Snowflake提供瞭很好的解決方案。國內也是因此,和美國團隊去交流後,我們認為這個趨勢在中國一定會齣現,所以2015年,我們找到Kyligence,2016年找到偶數科技。
過去的一年,我看見不下十傢早期中國創業團隊,第一輪融資後就齣來說要做中國的Snowflake、Databricks。坦率說,如果做完全一樣的雲原生數倉,這些創業團隊有點晚瞭。也許你能拿到1億、2億美金來支持行業發展,但整個産品的成熟還需要一定時間去沉澱。
大數據、數據倉庫,數據庫領域在中國有很多的機會,希望創業者齣來以後,能夠瞄準自己的市場需求,踏踏實實把産品做好,為行業以及技術發展做貢獻,而不是說單純說“我就是中國的Databricks”。隻有把産品做好,纔能夠真正的在市場上立足。
過去的一年,也有很多資本進來。資本是雙刃劍,拿錢多的可能跑得會更快,但産品成熟度是有一定的時間周期和規律的。資本要有耐心,可以陪這些公司跑下去。
5,國産AP(分析型數據庫)的機會
偶數科技CEO常雷:
一方麵,雲原生分析型數據庫對客戶有兩大好處:一是可以節約成本;二是存算分離,可以實現超大規模集群。
從技術層麵看,已經可以解決“湖倉一體”的本質問題,而不是“湖倉分體”。
這兩點是客戶的痛點,也是我們布局市場的思路。
雲化趨勢下,細分領域數據庫的優勢體現
1,混閤雲環境下,有什麼樣的挑戰?
騰訊雲數據庫副總經理王義成:
有報告曾預測,未來75%的數據庫將會跑到雲上。上個月我和分析師交流時, 他們認為2023年,這個比例有可能會到80%。
2012年,互聯網客戶對於雲數據庫的選擇,或對雲的選擇都是中立觀望的態度,2016年後纔開始齣現大客戶。實際上,最初的互聯網客戶選擇雲數據庫,主要是因為IO的性能不足,纔選擇瞭雲數據庫。但現在,整個泛互聯網行業選擇雲,已經變成天生的選擇瞭,不再去糾結。
IDC的報告顯示,在IDC機房租用的資源,帶寬和相應的成本已經和真正機器的成本不相上下。這個趨勢導緻選擇雲比IDC自建有更大的優勢。或許有些廠商發展到足夠大後,齣於成本的考慮,會和雲廠商博弈,但至少我們瞭解的許多大客戶,從雲搬迴IDC的很少。
此外,一般來說,政府、金融等行業齣於自身考慮,不可能去做雲化,但今天也齣現瞭很大的變化,比如建行和銀聯基於騰訊私有雲,去搭建自身的建行雲和銀聯雲,然後在自己的雲上開展相應的服務。政府領域,廣東的政務雲也是基於騰訊的私有雲平台構建。這類金融和政府可能並不算公有雲,但是經過討論,隻要是雲廠商提供相應技術,大客戶進行孵化,分析師認為這也叫雲,所以也屬於雲數據庫。
綜上所述,我覺得80%的數據並不誇張,這是大勢所趨。
偶數科技CEO常雷:
針對廠商來說,混閤雲相對來說還是比較新的。但 混閤雲很大的痛點,就是怎麼把混閤雲上的數據和應用打通。 數據打通其實很難,尤其是公有雲和私有雲,兩邊還是公網,如果拉專綫也比較麻煩,尤其是上麵是各種各樣的數據庫,本來要一體化的數倉或者是數據庫,也就是湖倉一體,又可能因為混閤雲隔離瞭。在這個領域,還有許多新的問題需要解決。
Kyligence閤夥人兼副總裁李棟:
在雲化的趨勢下麵,我覺得可以從數據角度做一些思考。
企業在麵對不同的技術選型時,以及不同業務開展時,都會麵臨各種各樣挑戰。舉個例子,銀行客戶很多核心交易數據必須在本地,但一些互聯網業務會選擇在雲上,甚至一些跨國企業在齣海時,會選擇多元業務,因為在不同國傢和地區會麵臨不同的技術選型。以前建數倉需要把一個集團的數據導到統一的數據庫進行集中式管控,現在數據是分散的,且由於政策原因,技術原因等等很難存儲在一起。
我們看到的趨勢是, 隨著技術架構的變化,數據存儲很難實現集中式存儲,一定是去中心化的架構。 數據倉庫的概念,本質上也是告訴大傢,可以接受數據隔離或者從物理隔離的現狀,更多采取在原數據或者從管理手段上的統一管理。
Kyligence其實也在分析型數據庫賽道,那我們如何幫助客戶解決這個問題?
我們是 Apache Kylin 的商業化公司,提供企業級的多維數據庫産品。多維數據庫中的多維數據模型,是很好的分析型數據資産的承載體,可以在數據孤島情況下實現統一的管理。我們的産品不僅提供一個SQL引擎,而是提供多維數據模型的概念去連接不同的數據源,並統一定義和管理業務分析使用的數據模型、維度和指標。通過這種方式,數據在混閤雲或者多雲的情況下是分散的,但這些多維度數據模式是統一管理的。
歐若數網NebulaGraph CEO葉小萌 :
我們接觸的客戶中,可能有90%的客戶都會用混閤雲或者多雲策略,包括我們自己現在作為一個初創公司,也用瞭很多的雲,這是一個非常自然的選擇。一方麵的話是從成本層麵考慮,另一方麵,很多用戶也不希望被某一個廠商鎖定。
圖數據庫也屬於數據庫,所以說,我們麵臨的挑戰幾乎是一模一樣的。比如從AP角度,如果用戶的數據去中心化,可能是跨雲的,那我們需要考慮怎麼跨雲快速access(訪問)。但一旦跨越access,成本就會增加,如何降低用戶的成本則從技術層帶來挑戰。從TP(交易型數據庫)角度,在綫數據庫很多數據會涉及隱私、閤規的考慮,有一些數據是不能放到公有雲上,比如說像金融行業、醫療行業。這類數據必須放在私有雲上,這種數據如何共雲?數據透明後可以放到AP上,然後利用公有雲的海量資源對數據做分析。但在TP角度,怎樣把大量在私有雲的數據和公有雲上的數據進行打通?
2,“東數西算”背景下,數據庫會有什麼樣的變化?
騰訊雲數據庫副總經理王義成:
“東數西算”對於數據換算的效率,或者整個數據提供的模式上有較大挑戰。
第一是數據庫布局需要多元化。基於大背景,騰訊在未來可能會有多種數據庫的布局。目前雲上我們大概有近二十款相關服務,也會繼續擴大引進不同模式的數據庫。
第二是算力提升。迎閤數據量級提升大趨勢下,我們要利用好新的硬件。因為數據量很大,整個計算的周期也會變長,計算精準度也要提升。那麼如何將數據庫和新硬件結閤?首先是要用存儲計算分離,把新硬件和緩存結閤,在性能和技術價格之間選擇綜閤方案。
偶數科技CEO常雷:
“東數西算”以及“雙碳”,都對數據庫提齣瞭新的要求。比如說新基建中,數據中心都要雲化,這對所有雲廠商都是很大的利好。從國傢層麵,可以設置一些相關的標準,比如,在上麵跑的雲或者軟件,是不是真的節能。
Kyligence閤夥人兼副總裁李棟:
東數西算、西氣東輸、南水北調本質上都是資源調配。數據作為一種資源也在進行調配。
數據是石油,但石油需要加工纔能被廣泛使用,如何把數據從資源變成更高價值的産品是關鍵。 很多金融客戶也在探索如何把數據從資源變成産品。
實際上,能用最經濟實惠的方式把數據變成産品(Data as a Product),是最關鍵的,數據能給業務帶來什麼價值纔是最核心的。
歐若數網NebulaGraph CEO葉小萌 :
東數西算是資源調配,對於廠商來說有一定要求。大量數據從東部往西部遷移的過程當中,並不是免費的。
所以,第一個要求就是對數據的壓縮、傳輸方式會提齣比較高的要求。 怎麼樣把海量數據以非常低的成本實現遠距離傳輸。 對於我們而言,可能會在數據傳輸上考慮更優秀、更高效的方式。 第二個則是在存儲計算分離的基礎上,能夠對計算資源調控,做到按需分配。 這樣可以進一步提升整個資源的使用率,同時降低用戶的成本。存儲計算分離也是我們目前在做的事情,在傳統的存儲計算分離的基礎上,我們更多地考慮資源的動態分布、動態分配的能力。
國産數據庫的商業化路徑選擇
1,開源數據庫與商業數據庫,商業化路徑如何選擇?
騰訊雲數據庫副總經理王義成:
開源的本質也是商業化,要從宏觀層麵看是否能滿足一傢公司的長期商業利益。
國內很多廠商做開源,但有成功商業邏輯的還比較少。
開源的本質還是擴大生態,擴大你的影響力。開源還是要找清楚自己的定位,目標客戶群。開源能否幫助産品突破,幫助公司完成阻擊。還需要具體問題具體分析。
偶數科技CEO常雷:
開源有開源的好處。開源之後,互聯網公司和用戶可以很簡單地理解産品內核,然後幫助做市場宣傳。開源也有開源的壞處,容易同質化。現在大部分成功的軟件都是閉源的。但對數據庫的早期發展來說,閉源沒有開源那麼容易做市場。綜閤角度來看,各有利弊。
歐若數網NebulaGraph CEO葉小萌:
開源是為商業化服務,大傢不會隻為瞭情懷來做一個傢公司。
在數據庫行業,其實有非常多成功的開源公司。開源的好處是在項目的初期能夠帶來大量的用戶。比如說,我們在投入新領域時,如果一開始不做開源,很難觸達到一些潛在的客戶。另外,基本上每一個成功的開源數據庫公司的商業模式都有一個共性,就是上雲。 這令我們思考,在國內雲還沒有完全流行的階段,我們應該如何做商業化?
Kyligence閤夥人兼副總裁李棟:
開源商業化常見的有兩種,一種是Open Core,一種是SaaS模式。我認為,開源的本質一是技術的創新,二是商業的增長,關鍵是把兩者形成閉環。
從市場的角度看,一些開源用戶來自互聯網行業,目前麵臨的技術創新挑戰更大,新技術會從這個行業先誕生,然後逐漸開源。比如,Apache kylin最早的容器化方案就是從互聯網行業開源,後續發現金融行業也有容器化需求,其基於開源儲備,就可以通過技術創新的方式服務商業。同時,商業裏的復雜場景和高級特性也可以反哺開源,促進技術創新。
2,國內數據庫企業齣海有機會嗎?
偶數科技CEO常雷:
國內市場有特殊性,相對海外市場更加不成熟。
一是客戶習慣瞭廠商圍著轉的狀態,在定製化文化嚴重情況下,廠商需要解決一個問題——如何讓自己的産品,在客戶端不會因為一些不必要的要求進行各種定製化。
二是收費模式的不同。國外已經從license模式走嚮瞭訂閱模式,但國內訂閱模式依然不是主流,客戶對於訂閱製模式依然在接受的過程中。
我覺得先把國內市場做好,再做海外。齣海過程中,相對國外廠商,中國也有一定優勢,如技術優勢和成本優勢。
Kyligence閤夥人兼副總裁李棟:
我們可以發揮中國市場的特色。 在國內的經典打法是先樹立大客戶標杆,再進行復製。在美國,企業喜歡用農村包圍城市的方式,從中小客戶中沉澱齣大客戶。
比如,國內一傢數據服務公司首先收獲的是金融行業頭部的銀行客戶,這些客戶無論是數據量,還是數據分析復雜度,在行業內都具有代錶性。通過這些大客戶的場景,國內企業齣海時會發現場景有共通性,而且具有領先性的。因為國內人口基數大,數據量和分析場景比海外更具技術挑戰。所以我們可以在國內與標杆客戶把産品打磨好,再到海外復製成熟場景。
歐若數網NebulaGraph CEO葉小萌:
根據去年信通院的數據,中國整體的數據庫市場隻占到全球數據庫市場的7%-8%。
所以,我的第一個觀點是: 任何一傢中國數據庫公司,都應該有全球化思考。 在中國做數據庫或者大數據方麵的公司,總數不會比海外的要少。然而,整體國內市場隻有海外的小份額,就算增長速度非常快,能達到百分之二十,公司整體估值也隻有海外公司的百分之二十。所以要做大,必須要去海外。
第二個觀點是,我們應該充分利用好國內市場的特點,如:中國有非常好的標杆客戶,有非常復雜的應用場景,龐大的數據量等等。如果我們能服務好國內的標杆客戶,齣海時則是降維打擊。此外,我認為對於任何一傢齣海公司來說,除瞭技術能力外,還需要強調易用性,需要瞭解海外文化。
責任編輯: