企业级AI应用:七大经验教训的详细简报 来源: OpenAI AI in the Enterprise
总览
这份由OpenAI发布的简报,分享了七家“前沿公司”在企业中采纳和应用人工智能(AI)的经验教训。报告强调,AI应用与传统的软件部署或云应用不同,它需要一种新的思维方式,即以实验心态和迭代方法来快速实现价值并获得用户的广泛接受。OpenAI自身通过研究、应用和部署团队的迭代合作,不断改进其模型和产品,并从客户用例中快速学习。报告的核心是总结并详细阐述了企业成功应用AI的七个关键策略。
主要主题和最重要思想
报告围绕企业如何有效地利用AI展开,识别出以下核心主题和关键策略:
- AI带来的变革: AI正在三个关键领域为企业带来显著和可衡量的改进:提升员工绩效、自动化日常操作、以及赋能产品以提供更相关、更具响应性的客户体验。这代表了一种“新的工作方式”。
- 迭代与实验: 最成功的公司将AI视为一种新范式,采取实验心态和迭代开发方法,从而更快地实现价值并获得更广泛的用户和利益相关者支持。
- 基于用例的策略: AI的应用并非“一刀切”,而是需要针对具体的业务用例进行定制和优化。
- 早期投入和复利效应: 越早开始投资和部署AI,其价值增长越能呈现复合效应。
- 赋能员工: 将AI工具交到最了解业务流程和问题的员工手中,能激发他们找到创新性的AI驱动解决方案。
- 解决开发者瓶颈: 自动化软件开发生命周期是加速AI应用部署、克服开发资源限制的关键。
- 设定大胆的自动化目标: 识别并主动自动化流程中重复性的工作,设定高远的目标以最大限度地释放人力资源。
- 安全与隐私至关重要: 企业级AI平台必须提供强大的安全、隐私和控制措施,以保护敏感的企业数据。
重要理念和事实
以下是对七个经验教训的详细阐述,包含重要事实和案例:
1. 从评估开始(Start with evals)
- 理念: 使用系统化的评估过程来衡量模型针对特定用例的表现。严格的评估能带来更稳定、可靠且具有韧性的应用。
- 事实/案例: 摩根士丹利 是一个很好的例子。他们通过对语言翻译、摘要和人工训练师(与专家顾问结果比较)等模型的评估,确保了AI应用的质量和安全性。
- 成果: 如今,98%的摩根士丹利顾问每天使用OpenAI,文档访问率从20%跃升至80%,搜索时间大幅减少。顾问有更多时间与客户互动,曾需数天完成的跟进现在只需数小时。
- 引用: “评估是验证和测试模型产出结果的过程。严格的评估带来更稳定、可靠的应用,并具备韧性以应对变化。评估围绕着衡量模型输出质量的任务,参照基准——它是否更准确?更合规?更安全?你的关键指标取决于每个用例最重要的方面。”
2. 将AI嵌入产品中(Embed AI in your products)
- 理念: 利用AI创造新的客户体验和更相关的互动,从而提升用户满意度和业务成果。
- 事实/案例: Indeed 使用GPT-4o mini 来改进求职者与职位的匹配。他们不仅推荐职位,还使用AI解释“为什么”推荐该职位,使体验更加人性化和相关。
- 成果: 这带来了显著的业绩提升:职位申请启动量增加20%,后续成功率(雇主招聘的可能性)提升13%。通过对一个更小的GPT模型进行微调,Indeed 在提供类似结果的同时,将token使用量减少了60%。
- 引用: “我们看到大量的机会继续投资于这种新的基础设施,以便帮助我们增加收入。” - Chris Hyams, CEO, Indeed
3. 现在就开始并早期投资(Start now and invest early)
- 理念: AI用例通过迭代不断提升复杂性和影响力。越早开始,组织从复合改进中受益越多。
- 事实/案例: Klarna 引入了新的AI助手来优化客户服务。几个月内,该助手处理了三分之三分之一的服务聊天,取代了数百名代理的工作,并将平均解决时间从11分钟缩短到仅2分钟。
- 成果: 该倡议预计将带来4000万美元的利润提升,同时客户满意度与人工支持持平。此外,Klarna 90%的员工现在每天使用AI,这加速了内部倡议的启动并持续优化客户体验。
- 引用: “这项客户互动方面的AI突破意味着为我们的客户带来更优越的体验、更优惠的价格,为我们的员工带来更有趣的挑战,以及为我们的投资者带来更好的回报。” - Sebastian Siemiatkowski, Co-Founder and CEO, Klarna
4. 定制和微调模型(Customize and fine-tune your models)
- 理念: 将AI模型针对特定用例进行定制和训练可以显著增加价值。微调可以提高准确性、增加领域专业知识、确保一致的风格和语调,并加速结果产出。
- 事实/案例: Lowe’s 与OpenAI合作,通过微调模型改进了其电商搜索功能,即使面对不完整或不一致的产品数据。
- 成果: 通过微调,Lowe’s 将产品标签准确性提高了20%,错误检测能力提高了60%。
- 引用: “当我们看到对我们产品数据进行GPT 3.5微调的结果时,团队的兴奋之情溢于言表。我们知道我们手头有了一个赢家!” - Nishant Gupta, Senior Director, Data, Analytics and Computational Intelligence, Lowe’s
- 微调的定义: 如果一个GPT模型是商店里买的西装,那么微调就是定制选项——根据你组织的特定数据和需求定制模型的方式。
5. 将AI交到专家手中(Get AI in the hands of experts)
- 理念: 员工离流程和问题最近,通常最适合找到AI驱动的解决方案。将AI工具交到他们手中比构建通用解决方案更强大。
- 事实/案例: BBVA 向其125,000多名员工在全球范围内推出ChatGPT Enterprise,并鼓励他们发现自己的用例,同时确保负责任的使用。
- 成果: 在五个月内,BBVA 员工创建了超过2,900个自定义GPTs,其中一些将项目和流程时间从几周缩短到几小时。影响遍及信用风险、法律、客户服务、市场营销、风险管理、运营等多个部门。
- 引用: “我们认为投资ChatGPT就是投资我们的员工。AI放大了我们的潜力,帮助我们变得更有效率和创造力。” - Elena Alfaro, Head of Global AI Adoption, BBVA
6. 解放你的开发者(Unblock your developers)
- 理念: 开发者资源是许多组织的主要瓶颈。自动化软件开发生命周期可以成倍增加AI带来的收益。
- 事实/案例: Mercado Libre 构建了一个名为Verdi的开发平台层,由GPT-4o和GPT-4o mini 提供支持,帮助其17,000名开发者统一和加速AI应用构建。
- 成果: Verdi 集成了语言模型、Python节点和API,使开发者能够更快地构建高质量的应用,无需深入源代码,同时内置了安全性、防护措施和路由逻辑。这加速了AI应用开发,赋能员工实现许多改进,包括提高库存容量、检测欺诈、定制产品描述、翻译和个性化通知等。
- 引用: “我们使用GPT-4o mini 设计了我们理想的AI平台,重点在于降低认知负荷,并使整个组织能够迭代、开发和部署新的、创新的解决方案。” - Sebastian Barrios, SVP of Technology, Mercado Libre
7. 设定大胆的自动化目标(Set bold automation goals)
- 理念: 大多数流程涉及大量重复性工作,非常适合自动化。设定高远的目标可以最大化AI的益处。
- 事实/案例: OpenAI自身通过构建内部自动化平台来自动化工作。
- 成果: 该平台在现有工作流和系统之上运行,自动化重复性工作并加速洞察和行动。例如,它与Gmail集成,帮助支持团队处理客户回复和触发操作。该平台每月处理数十万项任务,释放人力进行高价值工作,并正向其他部门扩展。
- 论点: 之所以实现这一点,是因为OpenAI 从一开始就设定了大胆的自动化目标,而不是将低效流程视为运营成本。
安全和隐私
报告强调了企业级AI平台的安全和隐私重要性。OpenAI为企业客户提供了以下保障:
- 数据所有权: 不使用客户内容训练模型,企业保留完全所有权。
- 企业级合规: 数据传输和存储均加密,符合SOC 2 Type 2和CSA STAR Level 1等顶级标准。
- 细粒度访问控制: 客户选择谁可以查看和管理数据,确保内部治理和合规。
- 灵活的数据保留设置: 可调整日志记录和存储设置以匹配组织的策略。
结论
总而言之,企业在应用AI时可以从这些前沿公司的经验中学习。核心在于保持开放、实验的心态,进行严格的评估并设置安全防护措施。成功的公司并非急于将AI模型注入每个工作流,而是围绕高回报、低投入的用例进行调整,在迭代中学习,并将学习成果应用于新的领域。AI带来的成果是清晰且可衡量的:更快、更准确的流程;更个性化的客户体验;以及更有价值的工作,因为员工可以专注于只有人类才能做好的事情。未来,AI工作流将自动化越来越复杂的流程,并使用各种工具和智能体来完成任务,例如OpenAI的Operator工具。