从“工具“到“员工“:企业对AI的期待究竟发生了什么变化?
去年我们组做了一个内部工具,让销售同事用自然语言查询客户数据。需求很简单:输入"上个月华东区成交金额超过50万的客户",系统返回表格。功能上线后反馈还不错,但有一天一个销售主管找到我,说了一句让我有点语塞的话:"这个挺好用的,但我能不能直接让它帮我写跟进邮件?"我说"可以啊,这个……得另外做一个功能。"他说:"为什么要另外做?你跟它说一声不就行了?" 那一刻我意识到,他脑子里的AI和我脑子里的AI,根本不是同一个东西。 做了几年开发,接触AI项目的方式通常是这样的:产品提一个需求,说要加一个AI功能。然后我们找一个合适的模型或API,把输入处理好传进去,把输出解析出来,接进业务流程,上线。整个过程里,AI是一个有明确输入输出的组件,和数据库、消息队列没有本质区别——它就是一个性能更好、处理非结构化数据更强的函数。 这种理解没有错。早期的AI落地基本都是这个模式,人脸识别、OCR、情感分类,全是这个套路。大语言模型出来之后,我们换了一个更强的模型,但范式没变:输入处理好,调用模型,解析输出,接业务。 Andrej Karpathy在2017年写过一篇文章(就是提出Software 2.0的那篇长文),核心观点是传统软件是人写规则,新软件是用数据训练出规则。但他描述的AI仍然是一个组件,一个学出来的函数,嵌在人设计的系统里。大多数人(包括当时的我)对AI的理解,也停在这里。 他描述的那个东西,更接近一个协作者。 他的意思不是"这个查询功能再加一个写邮件的按钮"。他的意思是:我跟它说我要跟进这个客户,它自己想清楚要查什么数据,查完之后结合客户情况,帮我写一封合适的邮件,如果有什么不确定的来问我。 这就是那个销售主管脑子里的AI,一名"数字员工"。 这个期待在今天并不罕见,而且正在成为越来越多管理层的默认假设。MIT 斯隆管学院在2023年做过一项调查,访谈了超过3000名管理者,其中67%认为未来AI在组织里应该扮演"协作者"而非"工具"的角色。这个数字在2020年是43%。 工具和员工的区别,不只是能力强弱的问题,而是谁来做决策的问题。工具等待指令,执行指令,返回结果。使用工具的人需要知道"下一步该做什么",并把这个决策翻译成工具能理解的输入。你用Excel做数据分析,你得知道先做透视表还是先清洗数据,这个判断是你做的,Excel只是执行。 员工接受目标,自己规划路径,遇到障碍自己决定绕行还是上报,完成后交付结果。你交给员工一个目标,不需要告诉他每一步怎么做。 把这个差别映射到软件上,工具型AI的系统设计是你作为开发者,在写代码的时候就把"下一步做什么"的逻辑写死了。AI只是其中一个节点,它的输入是你准备好的,它的输出是你解析的,它调用什么、不调用什么,全在代码里。这是现在大多数AI功能的实现方式,也叫AI Workflow。 员工型AI的系统设计则是AI自己决定下一步做什么。它拿到一个目标,自己判断要查哪个系统,要调哪个接口,调完看结果,再决定下一步。开发者不再写"先做A再做B再做C"的逻辑,而是给AI提供一套能力(可以调用的接口),让它自己组合。后者在技术上有一个名字叫AI Agent,或者叫自主式AI。 大语言模型的推理能力到了某个临界点之后,员工型AI从"理论上可行"变成了"工程上值得尝试"。 OpenAI在GPT-4的技术报告中放了一个benchmark叫HumanEval,测的是代码生成能力,但更有意思的是他们测了一系列需要多步推理的任务,GPT-4的表现比GPT-3.5有显著跳跃,不是渐进式提升,是台阶式的。这类台阶,往往意味着某个能力从"够用"变成了"可以依赖"。而GPT4,是2023年发布的模型。 所以,现在的情况是技术上,员工型AI已经可以在某些场景里真正运转;预期上,管理层和业务部门已经开始用"员工"而非"工具"的框架来想象AI;但工程上,大多数团队还在用做工具的方式做AI。 这个落差,就是接下来这个系列要讨论的核心问题。 想明白这件事之后,一个新问题随之而来。如果AI要自己决定调哪个接口、查哪个数据,它怎么知道你的系统里有什么? 你公司的CRM里,客户联系记录叫contact_log,成交记录叫deal_record,你的同事进来工作第一周要专门培训才能搞清楚这些东西。AI凭什么直接就知道? 这就是这个系列下一篇要讲的内容。我们认为的AI是什么
销售主管认为的AI是什么
这件事换一个人来做是可以的。你把这个任务交给一个实习生,他会打开CRM查数据,翻一翻邮件记录,然后起草一封邮件给你确认。他不需要你告诉他"第一步查CRM,第二步看邮件记录,第三步写邮件"。他理解任务目标,自己规划步骤,遇到问题来问你。这两种理解之间有一条沟
为什么这个转变现在才变得紧迫
具体体现在两件事上。员工型AI有它自己的难题
这个问题,不是提示词能解决的,也不是RAG能完全覆盖的,它需要一套系统性的方案。让AI能够理解你的业务系统,知道里面有哪些概念、哪些操作、这些东西之间是什么关系。