ai和机器学习的发展历程是颠覆性的。最初,我们从手动编码转向通过数据训练计算机。在早期阶段,ai只能处理特定任务,例如分类和物体识别——这些是它们经过明确训练后能够执行的功能。
但这一切在2022年底随着openai推出chatgpt而发生了改变,这一突破性工具不仅可以生成内容,还能执行各种任务,迅速吸引了全球数百万人的关注。正如gartner在2023年ai技术成熟度曲线中所指出的那样,genai已经达到了“膨胀期的顶峰”,预计将在未来5到10年内进入“生产力平台期”。
克服挑战与局限性
根据gartner的定义,达到生产力平台期意味着ai将被广泛采用,其优势将得到明确定义,并有清晰的实施指南。要实现这一目标,我们首先必须解决当前ai技术的局限性,并探索如何通过智能体来克服这些挑战。
尽管当今的大型语言模型(llms)在生成电子邮件、写作文章和进行情感分析等任务上表现出色,但它们在处理复杂任务时仍然存在困难,例如复杂的数学计算或多步骤问题解决。此外,llms还存在其他显著的局限性:
• 幻觉或误导性输出
• 技术限制,如有限的上下文长度和内存
• 输出中的偏见
• 可能产生有害或不当言论
• 知识有限(例如,chatgpt 3.5的知识截止日期为2021年9月)
有趣的是,这些挑战与我们人类所面临的问题并无太大不同。我们也容易犯错误、存在偏见、记忆有限,有时甚至会做出有害的回应。为了管理这些不足,我们通常会:
• 在线寻找信息,使用excel和word等工具。
• 多次修改我们的工作以纠正错误并提高质量。
• 寻求同事和导师的反馈,并吸收他们的见解。
• 团队合作以取得更好的结果。
通过应用类似的策略,我们可以改进大型语言模型(llm)的输出,从而引出genai智能体的概念。
什么是genai智能体?
genai智能体旨在克服当前llm的许多局限性,能够执行单一模型无法处理的复杂任务。例如,如果你想从一个数据集中识别出按收入排名前三的公司,智能体将会:
• 获取所有公司的收入数据。
• 按收入对公司进行排序。
• 返回排名前三的公司。
为了实现这一目标,智能体将llm与关键组件结合起来,如规划、记忆和工具:
• 规划:智能体使用llm制定并执行计划。
• 记忆:智能体在执行多个步骤时保留信息,从而能够处理复杂任务。
• 工具:智能体使用各种工具来执行特定任务,以下将对此进行更详细的讨论。
genai智能体的关键特性
genai智能体被设计为:
• 规划和执行任务
• 反思结果
• 使用工具实现特定目标
• 在最少的人工干预下运行
此类智能体的例子包括网站建设工具、从excel表格中提供见解的数据分析师,以及根据用户输入规划旅行的旅游代理。
工具在genai智能体中的作用
工具对于智能体至关重要,使其能够有效地执行任务。在genai的领域中,工具使llm智能体能够与外部环境和应用程序进行交互,例如进行互联网搜索、代码解释器和数学引擎等,这些工具可以访问数据库、知识库以及外部模型。
例如,一个旅行代理需要工具来搜索和预订航班,还需要搜索互联网的工具。其他工具可能包括:
• 实体提取:从非结构化文档中提取特定信息。
• chat db:无需sql知识即可从数据库中检索信息。
• 知识机器人:使用检索增强生成(rag)技术,根据自定义知识库回答问题。
• 互联网搜索:根据用户查询从搜索引擎获取内容。
• 摘要生成:为大型文档提供针对特定角色的摘要。
• 程序执行:执行python代码以解决特定问题。
• 维基百科搜索:根据用户查询从维基百科检索内容。
• 比较:回答比较性问题,如性能指标或产品推荐。
智能体设计模式
为了执行复杂任务,智能体必须有效地协调这些工具。基于andrew ng的讲座,已经出现了几种智能体设计模式:
• 反思:llm评估自己的工作以改进输出。
• 工具使用:llm利用工具,如网络搜索或代码执行,来收集信息和处理数据。
• 规划:llm制定多步骤计划以实现目标,然后执行该计划。
• 多智能体协作:多个ai智能体协作,分配任务并讨论想法,以寻找更好的人生就是博尊龙凯时的解决方案。
尽管前两种模式会产生可预测的结果,但后两种仍处于实验阶段。
llm智能体框架
基于对智能体、工具和设计模式的理解,规划模式的一种变体逐渐形成。这个框架包括定义一个任务或目标,然后通过迭代的方式规划并执行下一个动作,接着进入反馈循环。
一个llm智能体由核心组件组成:
• 大脑/llm:作为协调者。
• 记忆(向量数据库):存储中间步骤和结果。
短期记忆:在上下文窗口内保存上下文信息。
长期记忆:一个外部的向量存储,提供相关的上下文信息。
• 工具/互联网:使智能体能够执行任务,如网络搜索或程序执行。
• 政策:通过设计确保信任,防止处理有害输入。
智能体的未来
genai的未来在于智能体与人类的协作。试想一个世界,医生、设计师和客户服务代表都由增强其能力的智能体支持。从科学发现到艺术创作,可能性是无穷的。
对于企业而言,将genai智能体融入运营中可以带来战略优势,释放出新的效率提升、个性化服务和问题解决能力,这些智能体不会取代人类的创造力,而是会增强它,推动一个充满创新和进步的未来。
企业网d1net(www.d1net.com):
国内主流的to b it门户,旗下运营国内最大的甲方cio专家库和智力输出及社交平台-信众智(www.cioall.com)。旗下运营19个it行业公众号(微信搜索d1net即可关注)。
人生就是博尊龙凯时的版权声明:本文为企业网d1net编译,转载需在文章开头注明出处为:企业网d1net,如果不注明出处,企业网d1net将保留追究其法律责任的权利。