Apache Kylin™ 是一个开源的分布式分析引擎,提供Apache Hadoop之上的SQL查询接口及多维分析(OLAP)能力以支持超大规模数据。

Apache Kylin™首创使用多维立方体预计算处理大数据查询,在Hadoop平台上提供亚秒级查询千亿记录的能力,提供标准SQL接口,查询性能比Hive快100~1000倍。其独创的稀疏立方体、压缩存储、微批处理构建等技术,很好的解决了大数据建立索引的指数级膨胀的难题,从而在查询速度上大大领先于其他基于MPP(大规模并行计算)等技术的解决方案,可以很好的满足百亿规模以上超大数据集提供快速的、高并发标准SQL查询的业务需求,并通过其ODBC、JDBC驱动及REST API等与BI工具,前端可视化技术等无缝整合。

Apache Kylin™也是第一个由中国人主导的Apache顶级项目,于2015年11月正式毕业成为Apache 顶级项目。2015年9月,Apache Kylin与Spark、HBase、Kafka等并列荣膺InfoWorld 2015年Bossie最佳开源大数据工具奖。这也是国人项目第一次获得该国际大奖。

Apache Kylin™在大数据分析领域应用广泛,获得了快速的推广。国内外一线的互联网,金融,电信等公司越来越多地采用Apache Kylin™作为其大数据分析平台。

培训对象

  • 各行业的数据分析师、数据挖掘师,BI、数据仓库、大数据等相关技术人员。

  • 各行业的各级管理者,高层决策者,数据化运营战略的制订者,推动者。

  • 对于大数据分析、数据挖掘及其实践应用感兴趣的高等院校或研究机构师生。

学员基础

学员需有数据仓库、BI等相关基础知识,熟悉Hadoop、HBase等基础技术,拥有相关Hadoop认证者最佳。

Apache Kylin™ Developer Training by Kyligence.

培训时长:3天

培训讲师:Kyligence

认证证书:Kyligence Certified Developer for Apache Kylin (KCDK)

  • Day 1 上午

    课程:
    1. Hadoop与大数据分析
    1.1. Hadoop概述
    1.2. 大数据时代的BI分析
    2. Apache Kylin概述
    2.1. 背景和发展历程
    2.2. 工作原理
    2.3. 技术架构
    2.4. 主要功能
    2.5. 与其它技术的比较
    2.6. 典型案例分享
    3. 数据的准备
    3.1. 星型模型
    3.2. Hive数据管理
    3.3. 了解维度基数
    3.4. 检查数据类型

  • Day 1 下午

    课程:
    4. Cube的设计
    4.1. 数据模型
    4.2. 维度
    4.3. 度量
    4.4. 聚合组
    4.5. Rowkey
    5. Cube的构建
    5.1. 全量构建
    5.2. 增量构建
    5.3. 历史数据刷新
    5.4. 合并
    6. Cube的查询
    6.1. SQL参考
    6.2. Cube的选择

    练习:
    设计和创建第一个Cube ,并完成构建、合并和刷新。

  • Day 2 上午

    课程:
    7. 任务管理
    7.1. 提交任务
    7.2. 任务状态转换
    7.3. 任务的诊断
    8. 使用Rest API
    8.1. 获取Cube元数据
    8.2. 触发构建
    8.3. 检测任务进度和状态
    8.4. 查询
    9. 与可视化工具的集成
    9.1. 驱动及接口
    9.2. Tableau/Excel/PowerBI
    9.3. Apache Zeppelin
    9.4. Saiku
    9.5. Custom Web App
    10. Kylin社区
    10.1. 获得帮助
    10.2. 提问和讨论
    10.3. 贡献代码

    练习:
    使用API构建Cube,并生成可视化图表
    尝试写脚本通过Rest API触发Cube的构建;并从Tableau/Excel通过ODBC连接Kylin,生成可视化图表。

  • Day 2 下午

    课程:
    11. Kylin的高级特性
    11.1. 近似Top-N
    11.2. 精确Distinct Count
    11.3. 原始记录的查询
    11.4. 事实表上的可推导列
    12. Kylin的安全特性
    12.1. 基于文件的用户验证
    12.2. 基于LDAP的用户验证
    12.3. 使用ACL权限控制
    12.4. 使用SSL加密

    练习:
    分别设计一个未使用和使用 Top-N的Cube,然后针对相同数据源,比较它们在大小、构建速度和查询性能上的区别。

  • Day 3 上午

    课程:
    13. Cube的常用优化方法和策略
    13.1. 空间优化
    13.2. 时间优化
    13.3. UHC维度的优化
    14. 关键参数及调优
    14.1. 如何设置参数
    14.2. 构建参数
    14.3. 存储参数
    14.4. 查询参数
    14.5. 字典参数
    14.6. 其它参数

    练习:
    对一个复杂的场景下的Cube,采用各种手段进行优化 ,使其空间有效降低,时间缩短,同时查询性能得到提高。定制某些配置参数,体验其对Cube的影响。

  • Day 3 下午

    课程:
    15. 日常维护和灾备
    15.1. 日常运维
    15.2. 垃圾清理
    15.3. 数据备份
    15.4. 数据恢复
    15.5. 版本升级
    15.6. Cube的迁移
    16. 企业版与开源版的区别

    练习:
    对一个Kylin环境做备份和升级;对元数据和存储做清理

FAQ

 

Q: 本次培训是开发者培训还是管理员培训?         
A: 本次培训是Kyligence Certified Developer for Apache Kylin (KCDK)开发者培训。后续还会有管理员培训推出。。    
Q: 本次培训的讲师是谁?
A: 本次培训由来自Kyligence的Apache Kylin的核心开发者授课。        
Q: 本次认证培训颁发什么证书?
A: 学员完成培训并通过考核后,发放两张证书:分别是由Kyligence颁发的全球唯一Apache Kylin开发者认证证书,以及由Kyligence及上海大数据联盟共同颁发的Apache Kylin开发者资格证书。
Q: 本次培训是中文授课还是英文授课?
A: 本次授课为中文授课。这也是首次Apache顶级项目的认证培训国内领先于国际率先开班。
Q: 本次学习后发给大家什么资料? 
A: 培训教材电子版和打印版;Kylin Sandbox VM以及练习用的范例数据。
Q: 食宿问题怎么解决?
A: 培训费中不含住宿,只包含2天的午饭。 如果需要,可以为您代定酒店。
Q: 培训后学员达到什么水平?
A: 培训后学员能够达到合格的Apache Kylin开发者水准,学员能熟练使用kylin,设计和查询cube。
Q: 认证考试如何考核?
A: 培训结束当场进行考核,考官提供提供练习用的集群和范例,并出题,学员根据要求设计cube;考官检查设计指标授予证书。
Q: 学员需要怎样的基础?
A: 学员需有数据仓库、BI等相关基础知识,熟悉Hadoop、HBase等基础技术,拥有相关Hadoop认证者最佳。各行业的数据分析师、数据挖掘师,BI、数据仓库、大数据等相关技术人;各行业的各级管理者,高层决策者,数据化运营战略的制订者,推动者;对于大数据分析、数据挖掘及其实践应用感兴趣的高等院校或研究机构师生都可以报名。

报名联系方式

联系人:仲先生

电话:021-61060928

邮件:training@kyligence.io

地址:上海浦东新区亮秀路112号Y1座405室

交通信息:地铁二号线金科路站

报名表下载:《报名表》