成立8年估值200亿美元,中国版的Snowflake在哪里? | 爱分析洞见

硅谷独角兽、云原生数据仓库厂商Snowflake启动 IPO,其猛增的营收和节节攀升的毛利率,向大家展现了一个正在蓬勃发展的新兴市场。云原生数据仓库市场背后有哪些驱动因素?随着中国企业数字化与上云进程的加速,中国市场是否也有类似的机遇?

 

硅谷独角兽 Snowflake 营收连年翻番,上月正式启动 IPO

 

据媒体公开报道,硅谷独角兽、云原生数据仓库(Cloud Native Data Warehouse)提供商Snowflake于2020年8月25日正式向美国证券交易委员会递交了上市申请,据其招股书披露的财务数据显示:

· 2020财年(截至2020年1月31日),Snowflake的营收为2.65亿美元,相比于2019财年增幅高达174%。到2021财年上半年(截至2020年7月31日),其营收达到2.42亿美元,相比2020财年上半年增长133%,预计全年营收将超5亿美元。

· 2019财年,Snowflake的毛利率为46.5%,到2020财年则提升到56%,而到2021财年上半年,这一数字进一步提升到61.6%。

据媒体披露,这家2012年才成立的独角兽,其寻求的IPO估值已经高达200亿美元。

尽管“云原生”的概念在近些年刚刚兴起,但数据仓库却并非一个新兴市场,而是有着长达三十年的漫长发展期。而我们要想知道Snowflake如今的估值有多高,可以参考下两家更早进入市场的数据仓库厂商的财务数据和市值:

· 成立于1979年,在传统数据仓库市场占据统治地位的Teradata,在经历连续多年的业绩负增长后,2019财年营收仍有18.99亿美元,但当前市值仅27亿美元。同时,其毛利率更是多年稳定在50%左右,已经难有提升空间。

· 另一家厂商是成立于2008年Cloudera,它基于Hadoop开源体系成长起来,并已经在Hadoop发行版市场中占据统治地位。在经历多年快速增长后,其2020财年营收达7.94亿美元,毛利率高达71%,而当前市值也仅有39亿美元。

 

 

可以看到,Snowflake在短短几年时间内,迅速在欧美市场崛起,估值大大超越成立时间更久的同类厂商。

相比于欧美市场,国内的云原生数据仓库市场尚处于早期,尚未出现像Snowflake一样经历如此快速增长的厂商。但是,考虑到中国企业潜在的对数据分析的旺盛需求,以及企业上云进程的逐步深化,中国的云原生数据仓库市场的机遇也值得探讨。

云原生数据仓库市场在美国爆发的成因是什么?国内市场未来的发展趋势如何?有哪些厂商有机会复刻Snowflake的增长轨迹?爱分析基于对中美市场的研究,以及对Snowflake投资方和Kyligence等厂商的调研,来详细探讨上述问题。

数据仓库历经漫长变革,企业需求变化是决定性驱动因素

 

要想准确评价“云原生数据仓库”对企业的真实价值,可以先回溯数据仓库的发展历史。

事实上,数据仓库是一项发展历程漫长的技术,其概念确立于上世纪90年代初,定位是为企业信息化建设过程中“烟囱式”数据治理困境提供治理能力,建设面向主题的、跨系统集成的分析型数据库,并最终服务于企业的业务决策。

在过去三十年间,企业对数据仓库的整体定位没有发生根本的改变,即为企业提供业务决策支持。

但是与此同时,数据仓库的技术路线却不断升级,从早期以软硬件一体架构、有限的扩展性、昂贵的扩容成本为特征的第一代数据仓库,逐步发展为基于开源软件框架、适配x86架构通用硬件、适应海量数据的计算、可灵活扩展的第二代数据仓库,以及基于云服务提供的第三代数据仓库。

 

 

从第一代数据仓库发展到第二代数据仓库,企业的具体需求变化主要体现在以下两方面:

· 面向海量数据的计算能力:随着数字化业务的增长,企业数据量呈现爆发式增长,数据从几个BP发展到上百PB级别,而第一代数据仓库在面对如此巨大的数据量的时候,会出现明显的性能下降。而第二代数据仓库一般基于Hadoop、Hive、Spark 等开源框架,以及Presto等开源MPP架构,能够实现针对海量数据的高效存储和计算。

· 更灵活的扩容能力:随着数字化业务的不断增长,企业对于数据仓库性能扩展的需求性更为迫切,但第一代数据仓库的扩展性较差。因此,第二代数据仓库逐步采取软硬件解绑、适配通用性硬件的分布式架构,为企业提供更加灵活、更低成本的扩容能力。

但是,第二代数据仓库的不足在于仍然需要依托于线下机房,在性能扩容的时候需要采购硬件,由此带来了较为高昂后期运维和扩容成本。

随着云计算的逐步兴起,第三代数据仓库——云数据仓库(Data Warehouse in Cloud)逐步出现,客户在在公有云上低成本、按需、高效地获取数据仓库资源,其优势在于以下两方面:

  • 更低的扩容成本:数据仓库成为了在云上准备好的虚拟化资源,用户仅需通过界面点击即可按需取用,实现近乎无限的可供扩容、启停、升级的计算节点数量,免去了笨重的硬件采购和线下部署过程。
  • 更低的运维成本:由于云计算本身具有“基础设施即代码”的能力,数据仓库的资源的分配完全可以通过自动化手段完成,降低了因大量运维人员的手动操作带来的运维成本。
企业数字化进程深入推进,云原生数据仓库价值何在?

 

第三代数据仓库同样存在局限,它更像是把第二代数据仓库直接搬到了云上,但却没有根据云本身的特性更好地对自身进行优化,因此仍然没有达到“云原生”的程度。

但是随着企业数字化深入推进,企业对云的应用程度也越来越深,对数据仓库的需求进一步发生了变化,推动了第四代数据仓库——以Snowflake为代表的“云原生数据仓库”的崛起。

 

 

在从DW in Cloud转向Cloud Native DW的过程中,企业的需求变化具体表现在以下几个方面:

1)更精细化的资源管理能力

传统的分布式数据仓库采取计算、存储一体化架构,不支持单独扩展,但在数字化业务增长的驱动下,计算、存储的性能扩展需求往往是不同步的,计算性能往往仅需要在负载高峰期间进行扩展,而存储性能则一般是长期、线性地进行扩展。

因此,云原生数据仓库在对象存储技术之上,采取计算、存储分离的架构,支持计算、存储节点单独扩展,从而实现了资源的精细化管理,有效降低了扩容成本。

2)全民化的数据分析、更高的计算性能

数字化时代,数据分析服务的使用者,从企业决策管理层进一步扩展到专业的数据分析师、一线业务人员,乃至企业外部生态中的合作伙伴。

因此,云原生数据仓库能够实现更优化的性能调度、多租户的权限管理能力,从而支撑海量数据分析用户的并发访问,同时实现跨部门、跨组织、跨地域的安全数据共享能力。

此外,除了来自企业需求的驱动因素,Snowflake之所以能够获得如此快速增长,另外两点原因在于企业IT基础设施的变化。

1)良好的云采纳基础

以AWS为代表的公有云已经深刻重塑了海外企业的IT基础设施,“上云”不但早已成为企业共识,更成为了现实。

事实上,Snowflake的成长周期,几乎与以AWS为代表的云服务厂商逐步建立起统治地位的周期同步。2012年是Snowflake成立的年份,而同样在这一年,AWS举行了首次开发者大会re:Invent,这也标志着云计算的用户群体开始得到空前壮大。

因此,以公有云订阅模式作为其主打商业模式的Snowflake,充分释放了大量公有云客户的数据分析需求,而且公有云特有的轻交付模式使得Snowflake的销售成本极低。

2)多云策略的普及

随着企业多种类型业务的全面上云,以及企业对业务稳定性需求的升级,多云策略同样成为企业共识。

因此,相比于AWS、Azure、谷歌云等公有云之上的云原生数据仓库,Snowflake能够提供非厂商绑定的、兼容多种公有云的、使用体验一致的数据管理能力,还可以进一步在多云之上提供容灾备份能力,中立性优势更加凸显。

国内市场竞争格局尚不明朗,但未来市场集中度将明显上升

 

红点创投早在2014年就领投了Snowflake的B轮融资。红点中国执行董事刘岚认为,国内云计算市场相比美国要滞后三到五年左右,对于这一点,投资机构们早有普遍预期,而大家更看重的是未来五到十年的成长潜力。从过去几年美国云计算市场的趋势来看,企业在IaaS层的建设结束后,会越来越关注云对企业的业务价值,PaaS与DaaS的重要性会越来越凸显,这也是Snowflake能够崛起的根本原因。

此外,中国的云原生数据仓库市场的发展存在一个很关键的有利因素,就是中国庞大的数据体量及潜在的数据分析需求,相比欧美更加旺盛。

由于中国消费互联网市场的爆发式增长,企业内沉淀下来的可供挖掘的数据比欧美更加丰富。因此,在中国经济转型的大背景下,企业对于挖掘数据价值的诉求比欧美更加旺盛。同时,由于国内同行业竞争的激烈程度,企业对于数据服务的敏捷型需求也更加迫切。

相比于美国市场,国内云原生数据仓库市场的竞争格局尚不明朗。首先,阿里云、华为云等公有云巨头厂商已经布局该市场,成为该市场里面的重要玩家。

在独立厂商方面,成立于2016年,源自Apache开源基金会项目Apache Kylin的中国云原生数据仓库厂商Kyligence,是红点创投在中国市场看好的一家独立厂商。红点创投是Kyligence的天使轮投资方,并持续跟投了A轮、B轮和C轮。

Kyligence作为一家独立厂商,在2016到到2019年间的短短三年时间,就已经完成四轮融资 。相比于公有云厂商,Kyligence的优势与Snowflake类似,同样在于更加中立的背景,带来了其在多云策略下的独特地位。

红点中国执行董事刘岚还认为,数据仓库作为一类企业级的基础软件,其需求相对标准化,这意味着其未来的市场集中度一定是较高的。

爱分析认为,由于独立厂商在云原生数据仓库市场中的独特价值,未来中国市场有机会诞生一家独角兽公司。

 

从真实案例出发,云原生数据仓库能解决哪些实际痛点?

 

Kyligence于2017年12月正式发布云原生数据仓库产品——智能数据云Kyligence Cloud,就是其基于领先的OLAP技术,结合云上大数据的最佳实践,为企业客户提供快速、易用、安全、可扩展、低成本的端到端大数据分析解决方案,从而支撑企业日益增长的云上分析业务。

 

KyligenceCloud兼容Azure、AWS、阿里云、谷歌云等多种公有云平台,能够接入来自业务系统、在线数据、日志数据、流式数据等多种类型数据源,并基于Spark等分布式开源框架和云对象存储功能,实现计算、存储能力的分离。

在以上这些能力基础之上,Kyligence结合自研的AI增强引擎和统一语义层技术,能够为分析师和最终用户提供全组织统一的、整合过的及优化过的全局数据视图,不论是在数据中心还是多云部署,帮助企业发现和管理最有价值数据,进一步简化超大规模数据的管理,高效支撑BI可视化、Excel报表分析、机器学习与数据挖掘等多种业务场景。今年,Kyligence也入选了《2020年中国ICT技术成熟度曲线报告》增强数据分析(Augmented Data and Analytics)代表厂商。

正如前文所述,云原生数据仓库的主要价值之一,在于应对多租户环境下的高并发分析痛点。这样的痛点在大型银行、零售企业、制造企业、房地产商等部门和员工众多的集团型企业,以及SaaS厂商等拥有众多企业客户的科技型公司,表现得尤为突出。

以Kyligence的海外某SaaS企业用户为例,该企业的200多家客户分布在全球40多个国家,涵盖了500强企业的三分之一,其SaaS平台上产生的年交易量达到80亿美元,而交易产生的数据量更为庞大。

该企业提供的SaaS平台,具备一项功能是为客户提供仪表盘(dashboard)可视化页面的功能,而数据源则来自于SaaS底层的数据仓库。这意味着即该企业的每家客户仅有一个账号,那么也会有超过200个用户同时访问数据仓库。

过去,该企业采用第三代数据仓库,即DW in Cloud的模式,面临的问题是在高并发的状况下,用户访问性能明显下降,不得不建立大量固化视图。尽管这种做法收获了一定效果,但是从长期来看,视图的创建和维护成本越来越高,而且最多仅能支撑10个左右的并发访问量。

因此,该企业在重新选择大数据平台过程中,选择了Kyligence Cloud,最终实现了以下几方面的效果:

 

 

  • 功能层面:为终端用户提供灵活交互的仪表盘,具备更加灵活的新需求响应能力,能够搭建支撑机器学习的开放平台;
  • 性能层面:具备更灵活的扩容能力,查询时间小于2秒,能够支撑超过100的并发数据访问量,数据准备时间缩短到1小时以内;
  • 安全层面:提供企业级的数据安全管理,包括数据恢复,以及行、列级别的访问权限控制等;
  • 成本层面:完全基于AWS,总拥有成本大幅降低。

 

 

面对待开发的中国市场,厂商该如何制定市场战略?

 

由于种种因素,中国大中型企业在上云步伐中,明显滞后于欧美市场,而且私有云占云计算整体市场的比重相对更高。

因此,Kyligence作为一家同时在中美市场发力的国际化厂商,其中美市场的进入策略存在一定差异。在美国市场,Kyligence已经入驻了AWS、Azure的应用市场,客户只需在线购买就可使用。但在中国市场,Kyligence在推动公有云PaaS商业模式外,提供更适合中国企业级客户的私有云部署版本,并对各类常见的私有云厂商产品进行了充分适配。通过中国客户独有的场景、数据量及业务需求,进一步改进和增强核心产品。

但是,Kyligence认为,中美市场最终发展的方向会“殊途同归”。

首先,中美企业的需求是完全一致的,即都是为了让数据仓库在云上以服务化的方式交付给企业,同时让企业以订阅式、按需取用的方式来获取数据仓库。

其次,中国企业对公有云的接受程度也越来越高。尽管金融行业由于政策性因素,仍然难以大规模采用公有云,但许多零售、制造等传统行业的客户,已经开始将创新业务乃至核心业务逐步迁移到公有云上。

Kyligence透露,现阶段Kyligence Cloud的公有云客户占比在40%左右,但是未来随着企业对公有云的接受度提升,这一比例将有望提升到70%,向Snowflake进一步靠拢。

此外,随着国内企业付费观念的变化,Kyligence Cloud目前已经开始广泛采用订阅式的收费模式来服务于私有云客户,这也是国内厂商当中比较领先的商业模式尝试。Kyligence认为,这一模式的最大价值,一方面帮助客户进一步降低了云端数据管理和分析的成本,同时也驱动厂商自身始终保持帮助客户成功,实现与客户长期共生和互利关系。

爱分析认为,智能数据云Kyligence Cloud带给企业的最大价值,在于通过云原生技术重构了企业的大数据平台,充分适应了云时代的客户诉求,帮助企业解决了全民化数据分析时代下的大数据量计算、高并发量访问、安全权限管控等痛点。因此,云原生数据仓库市场在中国的黄金时代,可能很快就会到来。