《云原生降本增效大咖说》是企业网d1net与腾讯云联合策划出品的访谈栏目,我们期望通过深度专访,挖掘企业应用云原生技术的驱动因素,探索各自的应用历程,了解企业面临的技术痛点以及解决之道,梳理云原生技术应用最佳实践的一系列方法论,向外界展示云原生技术的价值,为中国企业的云历程再添助力。
本栏目采访了腾讯云、蒙牛、中国黄金集团、海尔、石化盈科5家企业技术大咖,来分享企业在部署云原生背后的思考、实践效果和方法沉淀。
作为全球白色家电龙头,海尔智家为用户提供衣、食、住、娱的智慧全场景人生就是博尊龙凯时的解决方案,全面提升用户生活品质,以“云”体验、全链路服务、个性化智慧终端,实现交互、体验、销售、服务于一体的全流程生态平台。
海尔智家全球数字化平台用到了哪些云原生技术产品?如何实现降本增效?在云原生技术应用方面有哪些实践和探索?云原生技术发挥了哪些价值?在本期“云原生降本增效大咖说”中,企业网d1net采访了海尔智家全球数字化平台技术总监高丽。她表示,海尔智家从2017年开始云原生试点,2018年全面拥抱k8s,多年来紧跟云原生的技术发展趋势,在产品技术和管理方式等方面做了一些尝试性的探索,经过五六年的积累,收获了一些心得。
以下是企业网d1net对海尔智家云原生应用实践采访内容的整理报道。
海尔智家全球数字化平台技术总监 高丽
企业网d1net:您如何看待云原生产品技术?海尔智家在云原生方面有哪些实践?
高丽:海尔智家从2017年开始关注云原生,彼时cncf刚刚发布了一些云原生的技术趋势。根据cncf给出的定义,云原生既包含技术,也包含管理。例如:技术方面包括微服务以及容器等基础设施技术,管理方面包含devops持续交付以及康威定律等诸多管理方式。
我理解的云原生是一系列云技术和企业管理方法的集合,它充分利用云技术的优势,为企业提供了一套从应用程序设计、实现、部署到交付的总体运营架构和方法。总体而言,云原生能够帮助业务快速迭代,是一种科技的进步。实际上,cncf至今仍未给出云原生的具体定义,它其实是一个不断自我演进的理论体系加最佳实践的组合。
2017年,在了解到以容器云为基础技术的云原生技术之后,海尔智家结合自身的诸多业务场景进行了一系列落地实践。例如:2017年,我们正在探索的业务中台建设,当时海尔正在向互联网、物联网的方向转型,我们既要面向c端消费者,又要面向b端客户,因此从业务中台的角度,我们需要建设人生就是博尊龙凯时的产品中心、客户中心等能力中心,不断沉淀海尔智家的业务中台能力。
在这一过程中,云原生技术发挥了很多优势,不论是底层容器云基础设施的稳定性,还是整体技术架构的先进性,都在帮助我们快速地实现业务需求。
企业网d1net:海尔智家采用云原生产品的驱动因素来自哪些方面?
高丽:海尔智家采用云原生技术的驱动力主要来自三个方面:
一是业务需要快速迭代。我们经常说小步快跑,但是怎么落地呢?肯定需要一套管理加技术指导的方法论来落地。而落的基础是什么呢?我们定位到了云原生的一系列产品,其核心是具备持续交付的能力,能够帮助业务快速迭代,这是其一。
二是降低成本,包括基础设施成本和人力成本两个方面。首先,容器云能够将服务器集群的多种资源池化,降低了基础设施成本。我最近做了一个测算,采用容器云之后,海尔智家提升了整体硬件的使用率,基础设施成本大约降低了37%,这对海尔智家来说是一个非常好的降本措施。
其次,降低了人力成本。用过k8s就能体会到,它能够通过先进的技术降低运维成本和人工投入,用k8s之前必须人肉监控,每天安排很多运维人员7×24小时值班,而云原生大大缩减了这类人力成本。
三是架构的标准化。我同时负责海尔智家全球数字化平台的技术架构,当时我们需要快速迭代的业务非常多,我一直在思考怎样结合一套产品实现松耦合的架构治理和落地。这意味着一方面要让业务快速迭代,另一方面架构又是松耦合的,发生任何流程和架构上的变化,都能快速适应。因此,选择云原生这条路持续实践,架构的标准化对我们而言非常重要。
企业网d1net:海尔智家应用云原生产品技术经历了怎样的过程?主要用到了哪些产品?
高丽:海尔智家从2017年开始探索云原生技术,此前一直在保持观望。2015年至2016年,我们发现docker的声量比较大,也有mesos等类似的一些容器技术诞生,但是那时我们不知道哪一种技术会成为主流。经过两年的观望,直到2017年,我们看到以kubernetes为基础的容器云逐渐壮大起来,所以我们沿着k8s的技术路线使用了一系列云原生产品。
从2017年6月开始,我们以k8s为基础进行容器云paas平台的初步试点,在实现容器云落地的同时,也用到了微服务以及企业架构治理方面的一些工具。从2017年6月到年底,经过半年时间的验证,我们认为这一平台基本可行,随后我们在2018年全面拥抱k8s,从基本的部署、监控、配置管理到服务发现,全部采用k8s技术。
多年以来,我们用到了很多云原生的开源产品,例如:镜像仓库用到了harbor;ci/cd开发流水线中使用的tekton,是google刚刚捐献给cncf基金会的开源产品;servicemesh用的是istio的人生就是博尊龙凯时的解决方案;serverless用到了knative、camel-k等等,这些都是我们目前正在用的一些开源产品。
企业网d1net:很多企业都在通过云原生技术产品实现降本增效,海尔智家在追求降本增效的过程中采取了哪些措施?还有哪些痛点和诉求?
高丽:运用云原生技术产品实现降本增效,对于我们而言是一个不断发现问题、解决问题的过程。在探索云原生的过程中,随着我们使用云原生技术产品能力的提升,我们顺便把it自身的管理流程也做了诸多优化,包括刚才提到的运维人员的缩减和运维成本的大幅下降,云原生带来的只有好处,没有坏处。
比如,在服务器被资源池化之前,人生就是博尊龙凯时的服务器归属于某个产品或某个项目组,现在用容器云进行资源池化之后,我们把资源的申请流程乃至每个产品和项目组对于资源的使用情况,做了很多透明化的处理,实现了管理工作的诸多优化。
实际上,云原生技术产品本身正在持续迭代的过程中,从安全的角度来看,还有待成熟。虽然目前云原生涵盖的技术多种多样,但是云原生平台的安全问题仍然是海尔自己探索的一个重要方向。同时,cncf基金会也会持续探索,收编更多安全项目。
企业网d1net:您最看重云原生技术的哪些价值?海尔智家应用云原生产品技术在降本增效方面带来了哪些效果?
高丽:任何公司在考虑云原生技术的时候,降本增效一定是首要目标,与此同时也会带来很多收益。比如增效,如果不用数据说话,可能很难有一个清晰的认识。我们在云原生技术的基础之上,开发了很多管理工具和平台,包括研发效能平台,如果粗略地计算一下,我们的需求交付周期从以前的20多天缩短到14天,通过这个量化的数值,我们发现确实提效非常惊人。从这个角度来看,云原生在降本增效方面确实做的非常好。
其次,我刚才提到了运维工作的简化以及运维人员的缩减,其实这是云原生本身的可观测性带来的价值。以前it的很多工作是不透明的,打散在服务器、中间件以及数据库等等各个技术领域,而云原生技术在各个层面都是可观测的,这种机制能够帮助我们快速地定位问题,同时对于出现的问题也能够快速恢复,这方面也是我们看到的一个非常重要的价值。
不论是传统企业,还是互联网公司,应用本身的可用性一定是it的底线,当应用出现问题后必须能够快速恢复,这样的可观测性机制,我认为是所有企业必须具备的能力。
企业网d1net:海尔在云原生技术应用方面还有哪些探索?
高丽:我刚才提到的云原生技术,大部分是在应用领域,比如订单系统这类应用系统。现在我们正在把云原生技术复制到大数据和人工智能平台上。其实,云原生技术对于这类平台完全适用,我们正在向大数据和人工智能的方向进行探索。
另一个是安全方面,在数字化转型的背景下,数据资产具有重要价值,云原生的devops平台,如今加入了security变成devsecops,正是在强调必须打下扎实的安全基础。例如,权限控制、服务级的动态隔离、访问控制等等,我们的安全策略要尽可能做到细颗粒度的管理,这是我们正在探索的另一个方向。
企业网d1net:目前海尔用到的云原生产品是哪家厂商的?其产品的优势是什么?
高丽:我们在2017年时选择了一款叫“才云”的成熟软件,现在已经被字节跳动的火山引擎收购了。我们在17年到18年两年的时间里,借用外部公司的成熟产品实现起步,在逐渐建设的过程中,我们发现基于云原生的技术栈,不能完全依靠外部力量,我们必须建立自己的团队去做一部分工作。
所以,在2019年底,我们基于市面上的开源产品,开始开发我们自己的产品模块。目前我们所用的容器云、serverless以及诸多开源工具,基本都是在开源工具的基础之上自研的。
对于产品优势,需要从企业的特性来看,海尔智家一方面基于云原生的技术栈不断深入演进,另一方面,我们既有面向c端消费者的应用,也有很多企业内部应用,这就决定了我们的形态,一定会用到混合云技术,我们把面向消费者的应用尽可能的部署到公有云平台。
我们认为,在混合云的基础之上,自研能够更好的发挥云原生产品的优势。目前,我们在混合云平台之上跑的所有云原生产品都是互通的,相当于我在一个统一的界面里,能够动态地调度公有云和私有云的资源,这是我们的一个优势。我认为,无论是自研,还是选择厂商的产品,都必须支持混合云下的云原生产品。
企业网d1net:从企业数字化发展和转型的角度来看,您觉得未来云原生在帮助企业实现降本增效目标上,还有哪些更大的价值可以发挥?
高丽:我认为除了降本增效之外,云原生还可以发挥更大价值。
首先,云原生改变的不只是技术,关键在于它能够帮助业务快速迭代,与此同时,业务的编码、开发的代码以及项目流程等必然会发生根本性的变化,比较典型的是:我们的业务逻辑会越做越轻,而云原生的技术底座会越来越厚。正因如此,不论是数据处理,还是非人用户的参与,例如基于事件驱动的机器人,这类不需要人去手工干预的自动化用户会越来越多,这些都会越来越智能化、自动化。
其次,从岗位的角度来看,我们刚才提到云原生给运维带来很大转变,其实不仅是运维,各类岗位都会有所触动,每个岗位的变化都是一个全方位的重构。
例如:像我这样的技术负责人,如今我考虑更多的是如何利用devops工具,能够重新看待整体的企业级研发流程;对于开发人员,他只需要专注于写好业务逻辑和业务代码,不需要再去关注中间件、数据库等等,因为云原生平台已经屏蔽了包括中间件、数据库、iaas等在内的各种问题;对于架构师,过去他要去组合一堆堆叠的技术栈,现在只需沿着云原生的技术栈持续演进,不需要在中间掺杂过多的技术复杂性。
最后,我们正在做工业互联网,云原生能够为工业互联网等全新的业务人生就是博尊龙凯时的解决方案赋能。目前,海尔智家的云原生技术应用主要是在服务器端的后台应用,其实基于工业互联网也有丰富的场景。例如,云边端的协同,云原生技术产品中包含基于边缘容器、边缘网络、边缘技术的版本——k3s,它是k8s的简化版,完全为边缘而生。
对于海尔智家正在做的工业互联网场景,云原生技术能够帮助业务,与业务一起构建应用,做到快速交付和统一管理。目前,海尔有几大灯塔工厂,未来在工厂里,云原生技术可以在工业互联网的环境中发挥更多价值。总之,云原生值得探索的方向还有很多。
企业网d1net:海尔在低代码或无代码开发方面有哪些探索?
高丽:目前,海尔在低代码开发方面已经小有所成。根据gartner预测,到2024年,65%的应用程序将使用低代码模式构建,低代码将推动几乎三分之二的应用程序开发。
怎样理解低代码呢?第一个是开发可编排,面向开发人员提供开发组件,实现代码与组件的复用。组件市场属于面向开发人员的低代码平台,它是一个开发的通用能力,比如微服务的脚手架,我们的开发人员通过海尔定义的微服务脚手架,能够快速搭建开发环境。以前每个开发人员需要花费7-10天才能搭建的环境,利用这个开发组件,只需要1-2个小时就可以完成。通过复用代码或组件,能够帮助大家实现快速交付。
刚才说的是开发后端,实际上在装配组件平台,我们提供了多种能力,包括前端开发,也可以通过这一平台快速聚合,生成新的交互页面,实现前端开发人员的效率提升。
第二个是服务可编排。所谓的服务可编排,能够快速通过拖拉拽的方式实现业务能力,这是我们目前正在探索的方向。
其实,海尔智家的业务流程非常复杂,在低代码开发方面,目前我们通过逐步解构已经实现了工作流的编排。以前,我们通过夯实云原生的基础底座,不断提升开发人员的效率,如今,在云原生的基础之上,我们正在通过组件的复用,继续提升开发效能。
结语
经过一系列深度访谈,企业网d1net与腾讯云发现,虽然大型传统企业选择云原生技术的契机、面临的挑战以及技术的实现方式略有差异,但是呈现的效果却殊途同归,云原生架构的先进性,在降本增效、快速迭代、架构标准化、资源复用、高效协同、业务松耦合管理、夯实安全能力等方面,发挥了显著作用。
云原生作为科技发展的重要里程碑,这项技术本身及其背后的一整套管理方法论正在持续迭代的过程中,为此腾讯云联合中国信息通信研究院、作业帮编写推出了2 万字的《降本之源-云原生成本管理白皮书》,系统介绍了如何通过云原生来提升it资源利用率,实现企业的降本增效。
白皮书中提出的“云原生成本管理模型”,在腾讯内部、外部客户历经大规模实践,实现了通过云原生技术并充分利用弹性技术,整体平均利用率提升到30%~40%;一些企业在使用云原生混部技术后,最高实现整体平均利用率提升到60%~70%。
下载《降本之源-云原生成本管理白皮书》
http://www.d1net.com/statics/images/ad/202206/20220601_tencent_cloud_wp.pdf
掌握提升企业it资源利用率方法论