保时捷案例:如何在云上数据湖搭建数字生态系统

 

1月,Kyligence 联合雅各布专栏举办了一场零售CIO沙龙,沪上四十多位知名零售业CIO出席了此次沙龙,精彩观点,请点击 此处 回顾。今天小编将与大家分享知名车企保时捷的主题演讲,看看传统汽车企业如何拥抱大数据变革。

关于保时捷

保时捷属于大众集团,总部位于德国,斯图加特,目前中国是保时捷最大的单一市场,2019年共出产8.6万辆,增速在10%左右,2018年的全球营收超过258亿欧元。保时捷在国内主要做车辆的进口、整车分拨、物流和批售,同时管理经销商网络,目前保时捷在全国有120多家经销商,另外包括市场与客户关系,售后,赛事也是保时捷的一大特色,客户可以在上海嘉定的赛车场体验中心学习各种赛道的驾驶技术,或者学习漂移,在赛道上体验保时捷带来的极速驾驶体验。在本地化的业务中,数字化的智能出行,随着整个电气化的战略推动,例如智能出行服务、充电基础设施等数字化产品服务是数字化工作的重点。
今年4月份,保时捷纯电动轿跑 Taycan 将在国内上市,相比于燃油车,纯电动轿跑的发布有许多准备工作要做,例如充电的基础设施,包括家充以及后续的维护保养,都需要通过数据分析来为保时捷的客户提供最方便、省心的服务。

演讲嘉宾介绍

Jason Zhu,负责保时捷大中华区(中国大陆及香港地区)的管理,在 IT 行业有近20年的技术服务经验,此前在意大利银行,负责中国区的投行和企业银行业务的IT管理,16 年正式加入保时捷。

保时捷数字化战略 —— 目标和运营模式

保时捷的数字化战略总结起来就是以下这张图,有点像刚刚升起来的太阳。

保时捷把数字化战略分成了三个主航道,最左边是产品和服务,随着电动车的推出,其实衍生出保时捷不再是一个卖车辆的品牌,我们的定位要提供专业便捷的出行服务,包含充电服务、代客泊车。中间展示的是客户触点,包括围绕车主相关的数字化战略,最右边是业务流程。

保时捷要通过数据来驱动业务,以实现我们的数字化战略。其实保时捷一直在思考,汽车行业发生了哪些变化,究竟有哪些改变给我们带来了数字化转型,以及从业务增长中去发现有哪些数据可以分析。十年之前买车是去4S店,现在用户买车其实也是一样,虽然汽车行业从营销端来说每家企业都做了很多尝试,包括电商,但是真正通过线上卖车还是少数,所以目前还没有产生特别革命性的变化。

对于汽车行业来说,客户购车的途径还是没有变,整车厂、经销商和客户之间的三角关系也没有变,那么对于我们来说变化在哪里呢?

保时捷数字化转型的趋势

第一个是我们发现移动端的应用已经成为一个趋势,且已经被消费者广泛接受,还有很多方向是和车辆相关的,现在的车都会标配车联网的服务,保时捷从2018年已经标配了无线互联网模块,这个是我们看到最大的变化,十年之前很难想象有车辆互联,当时大部分车连 GPS 都没有。但是现在情况变了,每辆车都可以做到互联互通,车是保时捷最主要的产品,我们需要关注的是消费者怎么使用我们的产品,用户在使用过程中有哪些问题,有什么偏好,会开车去哪些地方,我们想从这些数据中找到客户洞察,因为汽车行业和一般零售不一样,汽车消费是非常低频的消费,换车的周期是3-5年,这是一个比较长的周期,所以保时捷更加关注客户如何使用我们的产品,车联网是非常好的工具,可以收集到客户的使用轨迹,从而分析我们客户的行为,进一步优化我们的产品。

传感器和无线连接是相关的,一辆普通的燃油车上平均有100多个传感器,通过这些传感器可以知道车辆的驾驶行为,车辆轨迹,发动机工作情况,所有的信息都会被采集,再通过车联网服务,加以分析和使用这些数据,对于用户的使用体验来说是非常大的保障。

说到电气化,很多人觉得把电池放在一起就是电气化的重要手段,其实电气化没有这么简单,电气化的核心技术是所谓三电,即电机、电控和电池。整车厂要做电池的数据分析,而电控是电车里面最难的一部分,几千节电池在车里面提供动力,我们要实时感知到每个电池工作的状态,要让这些电池稳定、安全得运行,说起来非常简单,但门槛不亚于造发动机。

保时捷基于车联网的大数据分析

第一,保时捷现在每年有8万辆汽车的增量,面对这么多的数据可能带来的业务价值,是让我们真正去对汽车行业或者保时捷本身实现数字化转型的重要参考。

第二,数据实时收集和分析,从技术到法规都已经很完善,现在政府都要求新能源车上一定要有监控模块,用来实时监控电车的运行情况,监管机构可以通过新能源车的实时平台,可以看到每辆车的运营状态,哪一辆车发生抛锚都能清楚知道。不管是从安全还是政府补贴的角度,所有新能源车都要有这个模块。

第三,对保时捷来说,我们通过车辆数据的分析,来优化和提升车辆的质量和安全保障。汽车是一个系统工程,即使在设计和工艺控制非常严谨的情况下,牵涉到上万零件组合,就一定有各种各样的问题。面对现在信息透明的网络环境,如何确保保时捷第一时间获知车辆状况,提前预判一些车辆问题,通知客户回厂检修和更换,也可以保障我们品牌的印象,同时还可以减少我们的索赔率,另一方面,做好故障分析也能主动改善我们的产品质量,这个是保时捷关注的最大的价值和机遇。

讲到保时捷的商业价值,目前在路上跑的有车联网服务的共有9万多辆,每天会产生3.6 GB 的数据,1800万行的数据记录,此前这些数据每天都在丢失,因为没有自己的大数据平台,除了产品质量相关的场景之外,我们还希望优化车联网服务,用户使用车联网服务的哪些功能,注册车联网的服务的时候浏览了哪些界面,整个使用流程是否顺畅,这些都是可以通过车联网数据分析展现的。

下图三个场景其实对电动车的策略有决定性的影响。

我们的充电服务,第一个问题我们在哪里布控电桩,通过对车联网的分析可以知道用户的轨迹,从而在合适的地方投资,同时可以给用户智能得推送适合他的一些充电服务和最近的电桩位置,反向我们还可以通过了解用户充电的一些特征行为来改善产品充电服务。最后一个场景是通过分析用户的物理位置来布局代驾服务,礼宾车、移动充电车等资源,通过有效的数据分析我们会知道保时捷的客户集中在哪些区域,有哪些使用习惯,从而有针对性投放这些资源。

基于云上数据湖大数据分析的业务架构

保时捷在做基于云上数据湖,首先是梳理业务架构,因为平台本身没有任何的价值,所以必须先研究哪些场景,哪些数据是最容易变现的。目前我们主要实时监控车辆,获取车联网的数据,同时识别客户触点的数据,这些数据的共性是它们都是实时海量的,因此大数据作为底层平台是支撑整个业务价值的。

在处理数据时既要让数据要本地化分析,同时数据要实现和总部的共享,因为我们的产品质量是总部控制的,所以通过数据的脱敏,最终把建模的数据给总部。

基于云上数据湖大数据分析的技术架构

对于业务而言很难理解数据湖是用来做什么的,但是实际上 IT 想展示实时数据和批量数据,这些数据像血液要经过处理和转换,才可以输送到大脑和四肢。下图左边两块是实时数据和批量数据,中间 EMR 是放在 AWS 上,这个是核心的一个组件,但是整个的数据湖远远不止这么简单,我们在下面经过了反复的推敲,有非常多的设计上的考量和试错的过程,很多往往我们在建设初期忽略这个因素,随着数据量增大之后,我们会发现这个会成为数据资产管理的瓶颈,主要是我们整个大数据平台当中我们上百个 Job 的调度和管理模块,最后是监控,我们认为这些在架构设计当中也是非常重要的部分,也花了很多的时间和精力试错。

在实施当中我们遇到最大的坑是 Security,因为我们如果说做一个传统的数据方案,用 Ranger 是很方便也很成熟,但是上云之后就不是这样的,如果用 Ranger 管控有很多的障碍,所以我们的数据湖实施团队花了很多的时间做尝试和实验,AWS 也给我们很多的支持,最后实践产出了一个可执行方案。

整个数据湖项目的落地花了三个月,最终我们系统应该是在2天前刚通过了所有的安全的流程上线的,这个时间效率对中国的企业来说可能不是很快的速度,但是对于保时捷这样的德国企业来说,感受到了高效的企业服务。

项目实施复盘

保时捷的数据湖建设项目经验,首先天下武功唯快不破,因为我们面临内部和外部的都很激烈。

第二建立清晰的目标,有效的大腿,正确的伙伴,我们做项目的时候要设立一个很明确的目标,做的时候就不要想这么多,要证明这个平台是可落地,可执行、可运营的平台,所以我们的团队围绕这个目标干了三个月。有效的大腿是指我们业务部门,如果 IT 技术层面驱动的话,要么落地不了,要么落地之后无法产生业务价值的,所以从项目一开始非常深度引入了业务部门和管理层。

第三技术选型不是想出来的,是干出来的,每次会做很多实验,别想了,去做吧,很多问题是在做了落地之后再暴露出来的。

第四靠谱敏捷的团队,非常感谢 Kyligence 团队,作为保时捷数据湖平台建设项目的实施合作伙伴,和内部数据团队一起,在过去的三个月里面付出了很多努力,包括AWS派出了很多架构师到现场支持我们数据湖的项目落地。

最后通过展示结果,与管理层,总部以及业务部门建立信任关系,从车联网平台,拿到数据分析数据不是平台的一部分,但是一定要分析数据,找到可实现的业务场景,并把结果展现给业务,让业务人员了解到原来可以通过数据分析看到一些客户洞察。所以建立信任关系很重要。

这个项目对我们来讲只是一个开始,我相信在座很多同仁已经实施到数据湖和大数据分析平台,保时捷来讲我们还是比较传统的,我们对自己的定位是追赶者,而不是一个领军人物。所以说平台本身是没有价值,我们的任务才刚刚开始,今年一年里面会和业务部门密切配合,通过这个平台进一步挖掘我们的商业价值,助力我们的数字化转型。

想知道 Kyligence 能为你做些什么吗?