可能是全网最深度的 Apache Kylin 查询剖析

源码级解析 Apache Kylin 查询流程

Apache Kylin 是 Hadoop 大数据平台上的一个开源 OLAP 引擎。它采用多维立方体(Cube)预计算技术,可以将某些场景下的大数据 SQL 查询速度提升到亚秒级别(相对于之前的分钟乃至小时级别的查询速度)。

由于其在 OLAP 领域出色的表现,在国内外积累了很多用户。我们知道,当用户输入一条 SQL 提交给 Kylin 进行查询时,该 SQL 是面向事实表和维度表的,而不是面向 Cube 的。 Kylin 是怎么做到这一点的呢?目前不论在网络上还是在已出版的书籍中,鲜有资料详细对此方面进行介绍。故此,来自蚂蚁金服的朱卫斌带来了源码级的 Kylin 查询深度剖析文为您揭晓答案。

本文将以一个典型的 SQL Text 例子和大家一起从源码级别看看 Kylin 到底是怎么做到把对原始表的查询转换为对 Cube 的查询的。虽是源码级,但不会贴很多代码,尽量做到以流程图加描述的方式讲清楚这个过程。

填写表单获取文章完整版 PDF

*输入不正确。 请确保正确填写所有必填字段。

想知道 Kyligence 能为你做些什么吗?