LLM如何超越RPA引领智能流程自动化时代
Internet

LLM如何超越RPA引领智能流程自动化时代
Joanne Chen, Jaya Gupta
/
leeron

2024-06-18
#智能体#自动化
智能流程自动化经历了三代演变:从最初的基于规则的RPA到今天LLM驱动的智能体,能够处理非结构化数据,理解上下文,并自动化复杂任务。

每个企业的核心都是各种流程的集合。从潜在客户生成和客户获取,到财务规划和采购,这些流程相互交织,一个流程的输出往往成为另一个流程的输入。随着企业的成长,流程数量也随之增加,形成了一个复杂的数据流和依赖关系网络。

RPA
RPA

为了应对这种复杂性,企业在21世纪初开始采用一种早期的智能流程自动化形式——机器人流程自动化(RPA)。RPA允许公司使用软件机器人(或称“机器人”)来自动化重复的、基于规则的任务,从而解放人类去处理更复杂、更有价值的工作。

RPA最初依赖于基于规则的自动化。这对于简单、结构化的流程效果很好,但导致了只能处理特定、预定步骤任务的僵化机器人。这些机器人通常缺乏AI,无法学习、适应或改进。即使RPA解决方案引入了一些AI,它们也仅限于处理结构化数据,无法利用大量非结构化企业数据(如电子邮件、文档和图像)。据许多分析师估计,非结构化数据占企业数据的80-90%。

这些限制导致了RPA采用的混合结果。尽管早期有一些成功案例,但RPA未能实现像麦肯锡在2017年和2019年预测的那样广泛部署。EY的一项研究发现,30-50%的RPA项目失败,而德勤的一项调查显示,只有3%的公司成功扩展了RPA项目。

近年来,AI的进步正改变这一现状。通过整合大语言模型(LLM),机器人获得了强大的新能力,大大扩展了其潜在应用领域,标志着从RPA机器人向能够在几乎任何领域与人类协作的自主智能体的转变。

在本文中,我们将追踪智能流程自动化的三代演变,每一代都以底层技术的进步和用例的扩展为标志。从21世纪初的基于规则的自动化开始,转向2010年代中期的云端机器人,最后探索当今崭露头角的LLM驱动的智能体。

我们相信,LLM的能力将使智能流程自动化的市场机会在未来十年内至少增长十倍。这使得它成为一个对专注于AI的创业者,尤其是那些在传统上被自动化服务不足的领域有专长的创业者来说,极具前景的领域。

在下面的市场图中,我们概述了每一代智能流程自动化中的主要参与者,以及我们对当前这一代中最感兴趣的一些垂直领域机会。

智能流程自动化的三代演变. 图片来源:Foundation
智能流程自动化的三代演变. 图片来源:Foundation

第一代:本地部署,基于规则的自动化

21世纪初,微软和SAP等科技巨头率先推出RPA解决方案,这些解决方案专注于自动化后端功能中的简单、重复性任务,例如数据输入、发票处理、财务记录对账和保险索赔处理。

第一代RPA机器人遵循严格的硬编码指令。如果任务偏离了预定规则,机器人要么停止工作,要么在未意识到的情况下犯错。随着公司规模的扩大及其流程的复杂化,这些基于规则的机器人的局限性变得愈发明显。即使是表单字段的微小修改,也可能导致整个自动化工作流的中断。保持这些RPA机器人正常运行需要不断监控、更新和重建。

许多公司将RPA视为对过时IT系统的临时解决方案。这导致了显著的集成挑战和成本,因为机器人需要定制以在传统软件环境中工作。设置RPA解决方案通常需要雇佣专门的顾问,他们需要花费数周甚至数月来绘制公司的现有技术堆栈和流程。

这一漫长的设置过程,加上本地基础设施和持续维护的成本,使得组织难以在RPA投资中实现高投资回报率。将这些项目扩展到整个企业更具挑战性,因为每个新流程或系统都需要其自己的定制机器人。

第二代:云端,横向解决方案

到2010年代中期,市场上出现了新一代RPA机器人,以云平台为特征。Automation Anywhere、UiPath和Zapier等公司开发了可以处理跨多个业务功能和软件系统任务的横向解决方案。

第二代RPA机器人通过捕获流程的业务逻辑并与其他软件工具(如电子邮件客户端、聊天应用、云存储服务、CRM和ERP系统)集成来工作。一旦配置完成,它们可以自动管理请求,协调多个系统和团队的工作流,并确保整个组织技术堆栈中的数据一致性。

云计算和API的兴起是这一更广泛RPA方法的关键推动力。云平台允许公司在不进行重大硬件和IT基础设施前期投资的情况下使用RPA。API使得将RPA机器人与多个数据库和软件应用连接变得更加容易,减少了定制集成的需求。基于API的自动化也比第一代基于GUI的自动化更加稳定和可靠,因为前者在界面元素发生变化时更不容易崩溃。

第二代RPA解决方案也开始整合AI。这使得机器人可以处理需要一定判断或理解非结构化数据的更复杂任务。然而,这些AI能力通常范围有限,仍然主要依赖于结构化数据和预定义的工作流。

第三代:LLM驱动的智能体

今天,我们正看到由LLM和其他生成式AI技术快速发展推动的第三代智能流程自动化的兴起。与之前的几代不同,这些新解决方案在其核心构建了生成式AI。

与第一代和第二代RPA机器人相比,LLM能够为智能体提供理解上下文、解释用户意图、应用推理进行复杂决策以及适应新任务的能力。重要的是,它们可以处理非结构化数据:这一能力使得医疗、金融服务和法律等依赖不规则数据的垂直领域得以实现自动化。LLM还可以针对这些领域的特定数据进行微调,使其能够深入理解每个领域的术语、概念和工作流。

由于LLM能够理解和生成自然语言,它们也能生成代码,从而解锁软件开发和维护中的高价值端到端自动化。生成模型具备自然语言和图像理解能力,使智能体能够使用虚拟工具(如按键、鼠标点击和滚动)导航任何数字环境,包括网站、软件应用和数据库。LLM还可以与API交互,使智能体能够访问广泛的软件工具和服务。最终,这将允许用户仅通过简单的文本表达他们的目标,而不需要指定实现目标的步骤。

垂直领域特定解决方案的崛起

随着LLM驱动的流程自动化不断成熟,我们预计会看到越来越多的AI原生、垂直领域特定的解决方案,能够自动化越来越复杂的认知任务。

像Tennr和Ikigai这样的初创公司已经展示了这种方法的潜力。

Tennr的LLM平台简化了医疗实践中的后台操作,处理诸如安排病人预约、协调转诊、审计保险索赔、管理医疗记录和发布付款等任务。

Ikigai则专注于转变供应链管理。它利用LLM聚合来自不同来源的数据,如采购订单、车辆跟踪信息和物联网传感器,并提供整个价值链的实时可见性。这样,它的模型可以检测并缓解潜在问题,例如通过重新路由订单以防止因发货延误引起的生产中断,或根据预测需求调整生产和库存。

其他初创公司如Tonkean和Fulcrum则在解决采购、金融服务和保险等领域的行业特定挑战。随着这些解决方案的成熟,它们将在几乎每个业务功能和行业中解锁新的自动化机会。

在Foundation,我们相信LLM、生成式AI和智能体架构的融合将推动企业智能流程自动化的指数级增长。曾经被认为过于复杂而无法自动化的工作流将很快被能够导航界面、推理解决问题并通过API完成任务和自主采取行动的智能体所接管