2025年伊始,有关人工智能变革潜力的讨论热度正不断攀升。人们对AI的关注焦点正从AI工具转向创建及部署AI Agent。在今年最新发布的文章中,美国数据分析与AI战略顾问、《信息经济学》作者道格拉斯·B·莱尼将AI Agent的发展归纳为七个进化期。
他认为,这七个层级融合了计算机科学的基础成果以及来自认知心理学和思辨哲学的见解,其中的每一层都代表着技术、能力和自主性方面的阶段性变化。这份框架能展现在数据驱动、人工智能引领的数字经济中不断增加的创新、蓬勃发展及变革机遇。
对于正在了解和构建agent的企业来说,了解Agent从简单的反应式系统到假想中的超级Agent实体的演变过程,可为旨在从战略层面利用人工智能的组织机构提供 Roadmap。我们也将针对企业当前Agent构建和进化的核心需求,为处于各个层级的企业提供技术升级建议。
第一层级——反应式Agent:应对当下情况
最基础的层级是反应式Agent,比如基于关键词匹配来回答问题的基础聊天机器人,或者是用于生成或翻译内容的机器人。它们完全依据当下情况运作。这些Agent不会留存记忆,也不会从过往经验中学习。相反,它们遵循预先设定的规则来对特定输入做出响应。反应式系统源于早期的人工智能研究以及有限状态机,这些基础概念是在 20 世纪中叶通过约翰・麦卡锡和马文・明斯基等先驱者的工作而出现的。
对于企业而言,反应式Agent能够简化重复性任务,比如处理客户咨询或实现定义明确的工作流程自动化。对于有更高需求的企业来说,要超越这种即将过时的能力,就需要引入能随时间收集、留存和分析数据的方法,处理复杂的交互活动,并实现更具动态性的行动。
技术升级建议
- 数据收集技术:引入日志记录工具,对 Agent 交互数据进行收集,如开源的 Log4j 等,为后续分析提供基础。
- 数据分析基础搭建:采用简单的数据可视化工具,如 Tableau Public,帮助企业初步了解数据模式,为后续留存和分析做准备。
- 引入简单机器学习算法:尝试使用基于规则的机器学习算法,如决策树算法,通过 Scikit - learn 库实现,让 Agent 初步具备简单的学习能力,以处理稍复杂任务。
- API 集成:将 Agent 与外部数据源的 API 进行集成,如天气数据 API,扩展其处理的输入类型,提升交互复杂性。
第二层级——任务专用型Agent:精通特定活动
任务专用型Agent在相对较窄的领域表现卓越,往往通过与领域专家合作完成定义明确的活动,在特定任务中的表现优于人类。这些Agent是许多现代人工智能应用的支柱,从欺诈检测算法到医学影像系统皆是如此。它们的起源可以追溯到20世纪70年代和80年代的专家系统,比如用于诊断感染的基于规则的系统“MYCIN”。
任务专用型Agent可能会为电商推荐引擎提供动力,确保顾客看到他们可能会购买的商品。在物流领域,这些人工智能体可优化配送路线,以降低成本并提高效率。
组织机构可以通过聚焦有着明确成功衡量指标的定义清晰的问题来构建任务专用型Agent,尤其是用于自动化的这类Agent。与领域专家合作对这些系统进行训练,可确保它们能提供切实可行的见解。
技术升级建议
- 领域数据深度挖掘:利用专业的数据分析软件,如 SAS,对所在领域的数据进行深度挖掘,获取更精准的知识,优化 Agent 性能。
- 强化学习算法引入:针对特定任务,采用强化学习算法,如深度 Q 网络(DQN),通过 OpenAI 的 Gym 库实践,让 Agent 在不断试错中提升任务处理能力。
- 知识图谱构建:构建领域相关的知识图谱,如使用 Neo4j 图数据库,增强 Agent 对领域知识的理解和推理能力。
- 分布式计算框架:若处理数据量较大,引入分布式计算框架,如 Apache Spark,提升数据处理速度和效率。
第三层级——情境感知型Agent:处理模糊性与复杂性
情境感知型Agent凭借其处理模糊情况、动态场景以及综合各种复杂输入的能力而脱颖而出。这些Agent分析历史数据、实时数据流以及非结构化信息,以便能智能地适应并做出响应,即便在不可预测的场景中也是如此。它们的发展在很大程度上得益于机器学习和神经网络的进步,杰弗里·辛顿和扬·勒昆等研究人员推动了这些进步。
复杂的例子包括分析大量医学文献、患者病历和临床数据以协助医生诊断复杂病症的系统。在金融领域,情境感知型Agent评估交易模式、用户行为以及外部市场状况,以检测潜在的欺诈行为。在城市规划方面,这些模型综合来自交通模式、天气预报和公共活动安排的数据,以优化城市物流和公共交通系统。
企业若要部署情境感知型Agent,就必须采用能够摄取并综合结构化和非结构化数据源的技术。迈向这一层级需要采用机器学习(Machine Learning)技术,并确保能获取高质量的结构化和非结构化数据。这还需要培育一种重视数据驱动型决策的文化。
技术升级建议
- 大数据处理平台搭建:搭建 Hadoop 生态系统,包括 HDFS、MapReduce 和 Hive 等组件,处理海量的结构化和非结构化数据。
- 深度学习框架应用:使用深度学习框架,如 TensorFlow 或 PyTorch,构建复杂的神经网络模型,处理和分析复杂数据。
- 自然语言处理工具包集成:集成自然语言处理工具包,如 NLTK 或 AllenNLP,更好地处理文本形式的非结构化数据。
- 实时数据处理技术:采用流处理框架,如 Apache Flink,实时处理和分析实时数据流,提升 Agent 实时响应能力。
第四层级——善于社交的Agent:理解人类行为
善于社交的Agent体现了人工智能与情商的交集。这些系统能够理解并解读人类的情绪、信念和意图,从而实现更丰富的交互。这一概念源于认知心理学,特别是“心理理论”,该理论认为理解他人的心理状态对于社交互动至关重要。西蒙·巴伦-科恩和艾伦·莱斯利等研究人员推动了认知科学中心理理论的理解,这为AI中此类Agent的发展提供了依据。
在客户服务方面,善于社交的Agent能够识别来电者语气中的沮丧情绪,并相应地调整回复内容。高级应用包括由AI驱动的辅导平台,其能提供富有同理心的反馈,或者是能够在商业交易中理解微妙暗示的谈判机器人。
要开发善于社交的Agent,组织机构需要投资于情感计算和自然语言处理技术。它们还必须确保这些Agent符合伦理标准,因为对情绪或意图的误读可能会导致信任问题。
技术升级建议
- 情感分析工具集成:使用情感分析工具,如 TextBlob 或 VADER,识别文本中的情感倾向,提升 Agent 对人类情绪的理解能力。
- 对话管理系统优化:基于 Transformer 架构,如 DialogFlow 或 Rasa,优化对话管理系统,使 Agent 能更自然地与人类交互。
- 多模态交互技术研究:探索多模态交互技术,如语音、手势等,增加交互方式,提升用户体验。
- 伦理审查机制建立:设立内部伦理审查小组,定期对 Agent 的交互策略进行审查,确保符合伦理标准。
第五层级——自我反思型Agent:实现内在认知与自我提升
自我反思型Agent这一概念进入了思辨领域。这些系统将具备内省和自我改进的能力。这一概念源于有关意识的哲学讨论,最初由艾伦·图灵在其早期关于机器智能的工作中提出,后来大卫·查默斯等思想家也对其进行了探讨。
自我反思型Agent将分析自身的决策过程,并自主优化其算法,这很像人类反思过往行为以改进未来表现那样。对于企业来说,此类Agent能够通过在无需人类输入的情况下持续改进策略(而非仅仅是流程)来革新运营方式。
例如,在制造业背景下,这类Agent能够监测生产线的低效问题,找出根本原因,并重新校准机器或调整工作流程以提高产量。同样,在营销领域,这些Agent能够根据实时反馈动态调整营销活动策略,从失败的策略中吸取教训以完善未来的方法。它们甚至可能创新出全新的吸引客户或优化运营的方法,持续改进自身流程以实现更优的成果。
然而,迈向这一层级的道路充满挑战,包括定义和衡量机器的“自我意识”、复杂的伦理考量以及所谓的“模型崩溃”(即Agent因过于依赖自身而非多样化的输入而导致性能下降)问题。
就目前而言,组织机构可以通过建立健全的反馈机制以及培育迭代学习的文化(针对其AI系统及其团队)来做好准备。
技术升级建议
- 元学习框架构建:构建元学习框架,让 Agent 能够学习如何学习,例如使用 Model - Agnostic Meta - Learning(MAML)算法,快速适应新任务。
- 可解释性 AI 技术应用:采用可解释性 AI 技术,如 LIME(Local Interpretable Model - Agnostic Explanations),理解 Agent 决策过程,便于调整优化。
- 反馈回路强化:强化反馈回路,不仅收集结果反馈,还收集过程反馈,如使用监控工具 Prometheus 和 Grafana 对 Agent 运行过程进行监控反馈。
- 伦理与安全测试:建立专门的伦理与安全测试平台,对 Agent 自我改进过程中的伦理和安全问题进行模拟测试。
第六层级——通用智能型Agent:跨领域应用
通用智能型Agent,即通用人工智能(AGI),代表着人工智能研究领域的一个长期追求目标。通用人工智能最初由约翰·麦卡锡等早期先驱者构想出来,旨在创建能够执行人类所能完成的任何智力任务的系统。与任务专用型Agent不同,通用人工智能基于跨众多领域的适应性这一理念,这需要学习算法、推理以及情境理解方面取得重大进展。
大型语言模型(LLMs)近期取得的进展暗示了通用人工智能的潜力。这些系统展现出跨学科综合信息、兼顾短期与长期目标进行优化的能力。例如,通用Agent能够无缝整合诸如分析金融和行业趋势、协调多个业务功能与策略以及处理利益相关者关系等任务,而且其效率和熟练度比人类高出一个数量级。
企业可以通过投资整合多个领域数据洞察的综合性人工智能系统来为通用人工智能做准备。这可能包括整合客户洞察、供应链优化和金融预测的平台。此外,促进人工智能开发者与企业战略家之间的协作对于使通用人工智能的能力与组织目标相契合至关重要。
技术升级建议
- 跨领域数据融合平台建设:建设跨领域数据融合平台,使用 ETL 工具(如 Talend)将不同领域数据进行抽取、转换和加载,实现数据融合。
- 多模态预训练模型应用:采用多模态预训练模型,如 CLIP(Contrastive Language - Image Pretraining),让 Agent 能够处理多种类型的数据。
- 跨领域知识迁移学习:研究和应用跨领域知识迁移学习技术,如基于对抗训练的迁移学习方法,使 Agent 在不同领域间快速适应。
- AI 战略规划制定:制定企业 AI 战略规划,明确通用智能型 Agent 在企业中的定位和发展方向,确保开发者与战略家紧密协作。
第七层级——超级智能型Agent:超越人类想象
处于人工智能进化巅峰的是超级智能型Agent。这一假想系统将在所有领域超越人类智能,促成科学、经济和治理方面的突破。尼克·博斯特罗姆等人使超级智能这一概念得到普及,超级智能引发了深刻的伦理和实际问题,而且很可能需要量子计算级别的技术。
超级智能型Agent可能解决的潜在问题包括通过分析大量相互关联的数据集和DNA来发现复杂疾病的治疗方法,为全球环境挑战设计可持续的解决方案。
当然,该阶段的Agent还未实现,但它是未来人工智能研究努力的方向,相信在各位同仁的齐心协力下,这一天的到来应该不会太久。
文中图片由AI工具自动生成,部分内容来源于Understanding And Preparing For The 7 Levels Of AI Agents,道格拉斯·B·莱尼,贡献者、数据、分析及人工智能战略顾问与研究员https://www.forbes.com/sites/douglaslaney/2025/01/03/understanding-and-preparing-for-the-seven-levels-of-ai-agents/