在数字经济时代,科技的飞速更迭仿若潮水。唯有那些能够灵活适应新技术潮流的企业,方能在竞争激烈的市场中赢得先机,将新趋势转化为无限商机。
戴尔科技集团全球首席技术官 john roese
临近2023年末,戴尔科技集团全球首席技术官john roese对外发布了2024年及未来技术预测与展望。他表示:2024年,生成式ai(genai)将从理论转向实践;安全方面零信任将落到实处;多云常态下,边缘平台将蓬勃发展;而在未来,量子计算与genai将相互结合,密不可分。
趋势一:生成式ai步入业务应用阶段
john roese强调,2024年,生成式ai依然是科技行业的焦点。尽管google、openai和阿里巴巴等公司在今年推出了生成式ai技术,但大多数企业仍然停留在实验阶段,未能将genai系统有效地应用于实际场景。然而,2024年一些行业的先锋企业将逐渐领悟如何将genai系统融入推理和生产流程中,使其从纯理论的探讨阶段迈入实际业务应用阶段。
在这一过程中,系统训练只是第一步,打造基于genai的企业业务用例至关重要。当前,大多数企业更倾向于使用全球范围内可获得的基础模型,通过模型调优和互联来提高性能。因此,系统开发的工作相对较为简化。
对于各个行业领域的企业而言,使用genai或gpt4等大模型的训练成本相当高昂,但是这些垂直行业的企业并不会直接在应用中使用这些模型,而是需要深入开发,向模型输入各类数据,使其真正转化为生产力的关键组成部分。
john roese指出:用现有计算基础架构运行生成式ai存在一定困难,因此cio、cto的首要任务是对现有it基础架构进行重新设计、演进、升级,以便进行大语言模型的训练和推理。其次,可以从基础模型出发,不断调优模型、连接现有数据集,实现快速起步。最后,需要根据生成式ai系统的用户规模,合理评估使用量和访问权限,谨慎选择适合优先落地实施的ai项目。
一、落地genai系统要解决诸多问题
1、如何构建高效的推理基础架构?在训练阶段,需要大型集群和加速的计算架构。而到了推理阶段,基础架构的规模主要由用户量决定,成熟的模型与少量的用户可能只需要一台服务器;而对于简单模型以及百万量级的用户规模,推理基础架构可能需要几十万台服务器。
2、如何将推理能力部署在合适的位置?以前企业要决定把训练放在哪儿,主要是数据中心,现在企业需要明确推理能力应该放置在何处。推理需要部署在数据和用户所在的位置,一般情况下不会集中在数据中心,可能被部署在边缘位置,必须靠近呼叫中心或客户所在的位置。
3、如何确保推理基础架构的安全?与训练基础架构只需保护数据中心不同,将推理基础架构部署到现实世界中,从数据中心延伸至边缘,包括工厂、制造中心、交通运输网络以及客户所在地,安全保护模式将面临巨大变化。不同类型的风险和攻击正在涌现。“黑客侵入边缘基础架构,把已经投入生产阶段的训练模型提取出来做一个反向工程设计进行模仿,这样的攻击已经实实在在发生了。因此,在将ai模型投入生产环境时,必须确保其安全性。”john roese提到。
二、cio在genai实施中必须做出取舍
2023年,企业纷纷列出了长长的清单,认为genai在许多事项中都有用武之地。然而每个生成式ai项目都庞大而复杂,需要投入大量人力、物力和财力。2024年,企业可能面临成百上千乃至上万个潜在genai用例,cio和企业领导者必须从中甄选出哪些是优先实施的项目。选对正确的项目将对业务产生积极影响,一旦决策错误,不仅会浪费大量资源,而且可能被竞争对手赶超,存在较大风险。
因此,对cio而言2024年的关键任务之一是划分轻重缓急,即在所有可应用genai的用例中,确定哪些是优先级最高的项目。为了做出正确选择,企业必须充分了解genai的价值,明确在哪些方面可以为企业提供最大的帮助,以更好地利用有限的资源。
三、企业的关注点将从训练成本转向运营成本
2023年人们认为genai的成本主要是训练成本,包括构建模型所需的服务器数量以及开发和维护人员的费用。在落地阶段,企业并不直接承担构建gpt4、gemini等大型模型的成本,而是会更关注应用阶段的运营成本。
以戴尔科技为例,戴尔科技正在建立基于知识的人生就是博尊龙凯时的技术支持系统,大约需要20台服务器,以及3个月左右的时间,而整个运营成本却是未知的。部署人生就是博尊龙凯时的技术支持系统后,戴尔科技内部员工可以提出任何与产品和技术相关的问题,并得到系统的回答。
“尽管系统的回答非常有用,但早期的模型显示,如果我们将其应用于我们的一些工程师,大约需要6000人,每月需要5000万次的交易量。因此,我们最终发现,与建立模型的成本相比,庞大的交易量带来的巨额运营成本更该被重新审视。”john roese介绍。
2024年需要审慎考虑,genai系统在经济上是否非常有益,即使成本非常高,是否依然愿意承担。
趋势二:基于零信任的安全架构将落到实处
零信任的概念早已为人熟知,是对网络安全架构的重新思考。与传统的被动网络安全防护模式不同,零信任的设计原则是“绝不信任,始终验证”,基于零信任的安全架构会对所有人、应用和设备进行验证,以保证安全性。
从安全策略和控制的角度,零信任强调对好的、坏的和未知的事物进行识别。对零信任而言,首先要识别好的和被允许的行为,并阻止所有非法的接入行为,实时解决潜在威胁。
尽管零信任不是一个新概念,行业正趋于成熟,但是端到端的零信任人生就是博尊龙凯时的解决方案并未全面普及,戴尔科技已在其边缘产品人生就是博尊龙凯时的解决方案中采纳零信任策略。
企业需要将零信任策略落到实处,零信任不仅是一款产品,更是一种架构和理念,生态系统的成熟将使零信任成为可能。将零信任原则应用于现有架构并非易事,然而,在全新环境,如ai工厂、边缘和新的云环境中,相对更加容易。因此,可以挑选高风险领域应用和全新环境实施零信任框架,而其他低风险领域则继续使用现有系统。
趋势三:多云常态下 边缘平台将蓬勃发展
ai离不开推理,推理要靠近数据,而很多数据都在边缘产生,例如生产中的边缘设备,安全监控摄像头等等,因此大部分推理是在边缘进行的,这意味着边缘平台是真正运行ai的场所。
在多云环境下,云服务提供商通常在集中的数据中心提供服务,但实际情况是,数据并非都存储在数据中心,而是分散在工厂、医院等边缘环境。因此,大型服务提供商和服务堆栈需要为每个架构建立自己的边缘平台,amazon、google、microsoft、vmware、redhad都有各自的边缘平台。
为了避免一个公司使用多个不同的边缘平台,戴尔科技提出将边缘平台与边缘工作负载分开的人生就是博尊龙凯时的解决方案。这种基础架构可以建立一个通用的平行平台,其上有软件和硬件编排,用于运营软件定义的平台。
戴尔科技的愿景是通过建立一个统一的边缘平台,提升安全性和自动化水平,避免针对每个工作负载和应用创建独立的平台。john roese认为,2024年这一愿景将加速落地,原因在于绝大多数企业的genai用例都涉及数据中心以外的边缘数据,需要借助边缘数据平台,让genai在利用数据时更加高效可行。
“我们认识到未来边缘上主要运行的工作负载是ai,因此我们加强了与包括数据公司在内的ai生态系统人生就是博尊龙凯时的合作伙伴之间的紧密合作,以确保我们能够打造和交付一个正确的基础架构,来支持企业级的生成式ai应用。”john roese如是说。
趋势四:量子计算与genai将密不可分
展望未来,john roese表示量子计算将在未来五年内走进现实。量子计算可以突破传统计算能力的极限,即在无限当中寻找可能的计算,因此非常擅长解决概率和优化问题。而genai正是一种概率计算,如果能优化量子计算以适应genai,将使genai运行更加高效。
量子计算解决了genai和大多数通用大模型对计算资源需求量极大这一痛点。混合量子系统将成为现代化ai的计算基础,ai工作将被分散于包括量子处理单元在内的一系列不同的计算架构中。
如果量子计算与genai结合,将带来genai系统能力的巨大飞跃,其惊喜程度可能不亚于chatgpt初现。尽管不清楚确切的时间点,但可以肯定的是量子计算架构和genai将会成为整个系统不可或缺的一部分。
小结
实际上,以上四大技术趋势紧密关联:2024年,企业会将生成式ai付诸实践,必然需要更先进的硬件,而未来5年内量子计算的突破有望进一步加速genai落地。同时,为了让推理更高效,cio必须将推理基础架构部署在靠近数据和用户的位置,因此打造现代化的边缘平台显得至关重要。
在新环境中部署零信任这一新的安全范式非常便捷,尤其适合全新的边缘平台和ai基础架构。john roese希望零信任的安全原则能成为企业构建ai基础架构的默认原则。
2024年,各类技术将通过互联互通、相辅相成,让genai加速在企业中落地,投入生产和推理。让我们拭目以待!
关于企业网d1net(www.d1net.com):
国内主流的to b it门户,同时在运营国内最大的甲方cio专家库和智力输出及社交平台-信众智(www.cioall.com)。同时运营18个it行业公众号(微信搜索d1net即可关注)。