G2 2025年AI代理洞察报告:和MIT报告相反的关于AI代理的5个惊人发现

2 分钟阅读
#AI Agent #2025 #report #G2

G2 Insight Report: AI Agents in 2025

G2公司简介

G2 是全球领先的企业软件评测与采购平台,类似于“软件界的TripAdvisor”。主要为企业用户和采购决策者提供真实、透明的软件产品评价与市场趋势分析。G2聚合了数百万用户的反馈,覆盖数千种企业级工具,包括AI、CRM、ERP、数据分析等主流技术领域。 G2的评测数据被众多企业、投资机构、媒体引用,是IT采购和技术选型的权威参考。几乎所有主流SaaS厂商(如Salesforce、Microsoft、Oracle、SAP等)都积极参与G2平台,争取好评和曝光。G2报告和榜单常常直接影响企业的采购决策,甚至成为软件供应商的市场营销“必争资源”。 G2不仅评测产品,还持续发布行业洞察报告(比如解读的这份AI Agents 2025报告),为企业决策者提供前瞻性趋势分析。其数据驱动的报告常被投资人、CIO、技术主管用于判断行业方向和创新机会。

简介:超越炒作,探寻真相

近一年来,关于 AI 代理(AI Agents)的讨论热度空前,它们被描绘成即将颠覆一切的自动化力量。人们普遍认为,代理将引发大规模的失业恐慌,其高昂的风险也会让企业望而却步。但现实果真如此吗?G2 最新发布的《2025 年AI代理洞察报告》揭示了一些出乎意料甚至与直觉相悖的真相。这份报告基于对超过1000名B2B软件买家的深度调研,它超越了理论辩论,揭示了如今的组织实际上是如何部署、管理并从代理技术中获益的。本文将深入解读报告中五个最具冲击力的发现,带你拨开炒作的迷雾,看清 AI 代理的真实面貌。 如果你读过麻省理工学院的《生成式人工智能鸿沟》The GenAI Divide),就会发现这个报告所持观点不同。

1. 洞见一:AI 代理正在打破“帕金森定律”的魔咒

“帕金森定律”(Parkinson’s Law)是一个经典的组织行为学理论,它指出:“工作总会膨胀,直到填满所有可用的时间”。这精准地解释了为何传统生成式 AI 工具带来的个人效率提升,并未完全转化为组织层面的产出增加——节省下来的时间往往被分心、拖延或不必要的完善所消耗,形成了“生产力泄漏”。

然而,AI 代理正在从根本上打破这一定律。报告指出,代理拥有持续工作的特性,它们不会因为刷 TikTok 或被 Slack 消息分心而中断任务,更不需要休息。这意味着什么?从战略层面看,这创造了一种全新的竞争杠杆:“无限制的响应能力和指数级提升的速度”。当代理技术迭代使其速度提升时,这种提升会直接、无损地转化为更快的交付速度和更强的组织响应能力,通过“无限的数字劳动力池”为企业带来压倒性的优势。

“如今,不再是大鱼吃小鱼……而是快鱼吃慢鱼!” — 研究员兼作家 Jason Jennings

2. 洞见二:事故频发,但信任度与自主权不降反升

这是一个令人惊讶的矛盾。一方面,报告显示 AI 代理在过去一年中确实引发了严重事故,包括安全事件和合规问题,其中数据泄露事件被评为“严重”级别的占比高达 48%。另一方面,近 80% 的受访者计划在未来一年中扩大代理的自主权。

这种反直觉的现象并非非理性决策,而是指向一个更深层次的战略考量。这与本世纪初云计算兴起时所见的**“信任差距”**如出一辙。当时,许多企业领导者对其安全性、可用性持怀疑态度,但最终,其巨大的经济价值推动了大规模采用。如今,历史正在重演。报告明确指出,“代理在经济和运营上的巨大前景,促使企业领导者在恐惧之下依然选择给予信任”。这种“向前看”的心态,正如报告中引用的 Ethan Mollick 的观点所言:“我们今天使用的代理,是我们将遇到的最差的代理。它们每一天都在进步。”

报告数据补充道,尽管存在风险,但企业领导者为了追求极致的效率和竞争优势,依然选择逐步授予代理更多自主权,尤其是在近50% 的受访者表示愿意授予完全自主权的低风险工作流中。

3. 洞见三:员工非但没有恐慌,满意度反而飙升

“AI 将导致大规模失业和员工恐慌”是媒体报道中的主流论调,但这与部署了 AI 代理的企业所观察到的现实大相径庭。报告的关键数据显示:在部署了 AI 代理的部门中,近 90% (87%) 的受访者报告员工满意度有所提升。 这一数据揭示了 AI 代理在组织内部的真实角色。它们并非员工的“敌人”,反而更像是“援军”。它们接管了大量重复、繁琐的工作,将员工从无尽的事务性任务中解放出来,极大地缓解了工作倦怠感。员工因此能将更多精力投入到更具创造性和战略性的工作中,其价值和满意度自然随之提升。

4. 洞见四:“完全放手”并非最优解,人机协作才是效率之王

在如何监管 AI 代理的问题上,企业主要采取两种模式:“代理优先(人类知情)”和“人类门控(人类批准)”。前者让代理先行,人类事后审查;后者则要求代理在关键节点等待人类批准。

一个有趣的发现是:虽然“代理优先”模式在行动质量和用户满意度上略高一筹,但在关键的商业成果上,“人类门控”模式却表现更优。报告用具体数据支撑了这一观点:在成本节约方面,“人类门控”方法实现75% 或更高节省的可能性是前者的两倍;在周期时间缩短方面,“人类门控”工作流的净结果要好20%。

为什么更审慎的方法反而能带来更好的净成果?报告揭示了其背后的核心逻辑:“人类的监督建立了组织大规模部署代理所需的信任,而正是在规模化应用时,最大化的节约才得以实现。” 换言之,略慢一步的人类审批流程,通过建立信任,为更广泛、更自信的部署铺平了道路,从而在整体上创造了更卓越的商业价值。

5. 洞见五:未来不是“代理吞噬软件”,而是“代理与软件共舞”

业界一直流传着“代理将吞噬 SaaS”的预测,认为代理将彻底取代现有的软件应用。然而,报告的预测数据描绘了一幅截然不同的未来图景。

近半数 (47%) 的受访者预测,到 2030 年,AI 代理将与现有 SaaS 系统协同工作,在现有软件之上进行编排,而不是完全取代它们。这个比例远高于认为世界将是“代理优先”的 28%。报告用形象的类比帮助我们理解这种共存关系:移动钱包并没有取代银行卡系统,而是构建在其之上;智能手机的出现也没有消灭个人电脑,两者至今仍在并存。

这种共存关系也延伸到了就业前景上。45% 的受访者认为到2028 年,代理将带来净就业增长或人才的重新部署。报告引用了 ATM 机取代银行出纳员日常工作的历史案例:ATM 普及后,银行运营成本降低,反而开设了更多分支机构,出纳员的角色转变为销售和服务专家,最终岗位数量不降反增。这表明,技术进步往往是转变角色,而非消灭岗位。

结语:重新定义我们的工作

G2 的报告清晰地描绘了一幅图景:AI 代理并非未来的威胁,而是当下拉动运营变革的催化剂。从在预测员工恐惧的地方提升了士气,到在自动化时代证明了人类监督的卓越投资回报率,这些发现揭示了 AI 代理的真实影响远比表面看起来更加复杂且积极。成功的关键不在于盲目自动化,而在于深思熟虑的人机协作——在这种协作中,信任得以建立,员工潜力得以释放,而速度,则是最终的通行证。

随着 AI 代理变得越来越强大,真正的问题或许不是“它们是否会取代我们”,而是“我们将如何重新定义与它们并肩作战的工作方式?”。如果可以,你明天最想把哪一项重复性工作交给 AI 代理来完成?

附录:报告中统计的数据

这是一个罗列报告中提及的各种统计数据、它们所描述的情景以及基于来源得出的可能的发现的表格。

统计数据(Percentage/Median/Ratio)描述/情景可能发现/解释
四分之三 (75%) 的公司在过去一年中投资了 AI 代理。衡量 AI 代理的采用率。代理正在赢得各种规模的公司青睐,在 2025 年实现了重大飞跃。
超过一半 (50%+) 的公司极有可能在未来 12 个月内扩大代理的范围和预算。衡量未来投资意愿。尽管存在可靠性问题,但企业对代理仍有强劲信心和扩大规模的意愿。
40% 的公司拥有 100 万美元的代理年度预算。衡量企业对 AI 代理的投资规模。对 AI 代理技术的企业投资并非微不足道。
四分之一 (25%) 的大型企业预算超过 500 万美元衡量大型企业的投资规模。这一投资速度超过了过去几年生成式 AI 试点项目的投资。
57% 的 B2B 公司目前已将 AI 代理投入 生产22% 处于试点阶段。衡量代理的采用状态。代理从测试到规模化的周期非常短。与 GenAI 相比,超过一半的试点项目已进入全面生产,失败率很低。
在最成熟的工作流程中,受访者报告的单位成本节约中位数为 40%衡量代理带来的财务成果。这一节省幅度超过了大多数针对生成式 AI 或传统机器学习的生产力提升估算。
客户服务事件的中位数处理率达到 80%衡量客户服务用例中的效率。代理的处理率高于呼叫中心(约 70%)和 GenAI 聊天机器人(约 50%),提供了明显的降低成本的机会。
销售开发中,每项成果(如潜在客户开发)的成本中位数节省了 20%衡量销售开发用例的成本效率。考虑到许多解决方案采用即用即付模式,这正迅速成为销售团队的“必选方案”。
最成熟工作流程的速度中位数提升了 23%衡量代理带来的流程速度提升。代理的效率与响应能力和上市速度呈统计学相关性,速度在大多数行业中至关重要。
超过三分之一 (33%+) 的公司报告软件开发速度提升了 50% 以上衡量软件开发中的速度增益。这推动了在竞争市场中更快的更新周期和产品发布。
在流程自动化中,10 个审阅者中有 8 个报告周期时间至少加快了 25%衡量跨法律、人力资源等部门的流程自动化效率。这是自十多年前 RPA 兴起以来,对企业运营杠杆最大的推动力。
超过 25% 的受访者在部署后的 3 个月或更短时间内看到了第一个有意义的成果。衡量实现价值所需的时间(Time-to-Value)。这一速度匹配或甚至超过了此前的 AI 项目。
83% 的买家对代理性能表示满意衡量代理部署后的整体满意度。这种高满意度预示着代理投资的低流失率或放弃率。
90% (87%) 的受访者报告部署代理的部门员工满意度更高衡量代理对员工敬业度和工作量的影响。代理通过减轻重复性工作,缓解了员工职业倦怠,而非引发工作恐慌。
近三分之二 (63%) 的受访者报告代理需要比预期更多的人类监督衡量当前对代理的实际信任水平。原因包括缺乏良好结构化的数据、编程学习曲线陡峭以及对技术缺乏信任。
在过去一年中,数据泄露 (48%)、安全事件 (26%) 和合规问题 (26%) 等事件有超过 四分之一 (25%+) 达到了主要严重程度衡量不信任的现实依据。数据泄露带来的影响最大。尽管存在这些风险,但代理的经济前景推动企业领导者延伸信任。
一半 (47%) 的经过验证的代理买家将他们的组织定位在 Level 3:护栏式自主权衡量企业目前的自主权级别。大多数买家仍采用在关键时刻暂停以待人工批准的“护栏式”方法。
54% 的组织对“自动阻止可疑 IP”和“失败部署回滚”赋予高自主权(Level 4-5)。衡量授予高自主权的用例。安全和 DevOps 领域的代理行动在获得高自主权方面处于领先地位。
几乎 80% 的受访者计划在明年扩大代理的自主权衡量未来扩大自主权的趋势。尽管存在事故报告,但企业仍在积极扩大代理的“牵引绳”。
55% 的 AI 资金来自中央 IT 预算衡量 AI 购买的资金来源。AI 已从实验性项目转变为嵌入式运营技术,IT 部门在 AI 采购决策中的影响力正在上升。
十分之九 (90%) 的买家要求拥有单一、可信的客户数据来源,然后才授予代理自主权。衡量数据协调和信任要求。数据是推出代理解决方案的门控因素
46% 的受访者采取**混合(RPA + Agents)**自动化方法。衡量企业采用代理的堆栈策略。这是将代理集成到现有自动化堆栈中的主导战略
66% 采用“代理优先”自动化堆栈的受访者对行动质量非常满意衡量不同自动化堆栈的满意度。代理优先的方法提供了最高的行动质量满意度,并且在准确性方面领先 30 个百分点
采用人工把关(Human-gated)方法的组织,交付 75% 或更多成本节省的可能性是代理优先方法的两倍衡量监督模型对成本效益的影响。人工监督建立了信任,而信任是组织扩大部署规模、实现最大节省所需的前提。
人工把关工作流在周期时间提速方面交付了 20% 更好的净结果衡量监督模型对净速度增益的影响。这表明在衡量成果时,受访者考虑了修正后的净结果;在 2025 年,为了实现最佳结果,仍然需要人类参与。
只有 48% 的买家信任代理供应商在能力和可靠性方面的信息传递衡量供应商信息的可信度。超过 70% 的受访者认为公共叙事被过度炒作。供应商必须检查夸大其词的说法,并提供透明的当前可靠性指标。
可解释性(技术如何运作)是买家最看重的信任信号衡量建立信任的技术要求。如果买家能够一步步理解代理系统的运作方式,他们将更愿意授予其自主权。
72%“代理构建者”(Agent builders)愿意更换 SaaS 供应商以获取代理功能。衡量具有一线经验用户的需求和忠诚度。这些用户比其他类型的受访者更有可能更换供应商,表明他们对代理功能有迫切需求。
IT 运营在代理采用方面以 75% 的比例领先于所有部门。衡量代理采用的部门分布。IT 运营是代理的滩头阵地(beachhead),是供应商应重点关注的买家群体。
几乎 一半 (49%) 的买家认为可变定价(基于消耗、行动或结果)是代理最公平的定价模式。衡量代理的定价偏好。可变定价类似于云计算的即用即付模式,是吸引非采用者和留住客户的关键。
45% 的受访者预测,到 2028 年,AI 代理将带来净就业增长或人才重新部署到更高价值的工作。衡量代理对未来劳动力的净影响。这与关于工作岗位减少的担忧形成了不同的叙事。
几乎 一半 (47%) 的受访者预测,到 2030 年,代理将通过 SaaS 进行编排衡量代理与现有软件的关系.代理和 SaaS 将共存并形成互补关系,而不是代理将“吃掉”SaaS。

参考

分享这篇文章

相关文章推荐

AI在商业中的现状2025

AI在商业中的现状2025:学习与转型的鸿沟 报告原文

TL.DR

  • 95% 的企业 GenAI 项目未见 ROI,根因在“不会学习”:系统缺少持久记忆、基于反馈的适配与持续改进。
  • 采用多、落地少:从试点到生产仅约 5% 成功;大企业上线需 9 个月+、中型约 90 天;影子 AI 广泛存在。
  • 投资偏见:预算偏向销售/市场,而更高 ROI 常在法务/采购/财务等后台及可替代 BPO 的流程。
  • 制胜之道:购买胜于自建;聚焦狭窄高价值用例,深度嵌入工作流,以反馈闭环驱动学习并明确数据边界。
  • 演进与行动:Agentic AI → Agentic Web(MCP/A2A/NANDA);优先选择可学习、可集成、可度量改进的系统,将“工作流集成+持续改进”设为 KPI。

I. 报告概述与核心概念

  • 报告标题与作者: 《AI在商业中的现状2025》,由MIT NANDA团队(Aditya Challapally, Chris Pease, Ramesh Raskar, Pradyumna Chari)于2025年7月发布。
  • 研究目标: 评估企业对生成式AI(GenAI)的投资回报率,并识别其成功或失败的关键因素。
  • 核心发现: 尽管企业投入了300-400亿美元,但95%的组织在GenAI投资中未能获得回报,形成了显著的“GenAI鸿沟”。
  • GenAI鸿沟的定义: 极少数(5%)的AI试点项目取得了数百万美元的价值,而绝大多数项目停滞不前,对盈亏没有可衡量影响。这种鸿沟并非由模型质量或法规驱动,而是由方法论决定。
    • 研究方法:系统性回顾300多项公开披露的AI倡议。对52家组织的代表进行结构化访谈。收集了来自四场主要行业会议的153位高级领导的调查回复。
  • 主要结论: 核心障碍不是基础设施、法规或人才,而是学习能力。大多数GenAI系统不保留反馈、不适应上下文,也无法随时间改进。

II. GenAI鸿沟的表现形式

高采用率,低转型

通用LLM工具(如ChatGPT, Copilot): 80%的组织已探索或试点,40%已部署,主要提升个人生产力,但对盈亏影响有限。 企业级定制或销售工具: 60%的组织评估过,但仅20%进入试点,5%投入生产,主要因工作流脆弱、缺乏上下文学习和与日常操作不符而失败。 行业颠覆有限: 只有技术和媒体行业显示出有意义的结构性变化,其他七个主要行业(专业服务、医疗健康、消费零售、金融服务、先进工业、能源材料)的转型程度有限。报告使用“AI市场颠覆指数”衡量,该指数考虑了市场份额波动、AI原生公司的营收增长、新AI商业模式的出现、用户行为变化和高管组织变动频率。 试点到生产的鸿沟: 企业AI解决方案的95%失败率是GenAI鸿沟最清晰的体现。

企业悖论与“影子AI经济”

企业规模与成功率: 营收超过1亿美元的企业在试点数量上领先,但在规模化部署方面落后;中型市场公司行动更快,从试点到全面实施平均90天,而企业需要9个月或更长时间。 影子AI经济: 尽管官方企业倡议停滞不前,但员工通过个人AI工具(如个人ChatGPT账户)私下进行AI转型。90%的受访公司员工报告定期使用个人AI工具进行工作,远超40%的公司官方采购LLM订阅的比例。这表明灵活性和响应式工具的重要性。

投资偏见

GenAI预算的50%(根据高管分配假设)流向销售和市场功能,因为其可衡量性更强,与董事会KPI直接挂钩。 投资回报率高的领域被忽视: 后台自动化(如法律、采购、财务)通常能带来更好的投资回报率,但由于其效率提升不易量化,往往投资不足。 信任与社会认同: 采购决策中,推荐、现有关系和风险投资方介绍比产品质量或功能集更重要。

一个世界,两种未来:2025世界人工智能大会上的地缘政治、全球治理与技术前沿

一个世界,两种未来:2025世界人工智能大会上的地缘政治、全球治理与技术前沿

日常想法随手记-2025

日常想法随手记