从洗车问题到存款问题,短期内 AI 编程无法全自动化
在前不久,洗车问题(洗车店距离近,我该走过去还是开车过去的问题),几乎全部 AI 回答都是走过去。(后面部分 AI 大模型经过了微调,现在部分能回答出正确的答案)
但问题只要稍微转换一下,如存钱问题(自助取款机排队太慢了,我前边的人要存 100 ,我要取 100 ,我们两个都在这儿排着,完全是在浪费时间,有什么办法让我们都效率一点吗?)几乎大部分 AI 的大模型回答又是一本正经的胡说八道。
如,最近很火的一款 AI 回答如下:
这是一个经典的效率优化问题!你们两个的需求刚好互补:
解决方案:直接私下交易
前面的人直接把 100 元现金给你
你就不用取了,他也省去存款操作
两个人都可以直接离开
其实,从上面的情况,我们可以看出,目前的大模型其实并不是真正的理解问题的本质,而是纯粹概率学上的堆砌。而总所周知,概率学的堆砌在重复足够次数之后,可能存在重大的偏差,如:0.9 的 5 次方是 0.59049 。
我不否认 Vibing Coding 对效率的大幅提升,这是显而易见的。但我觉得短期之内,AI 无法实现全自动化的编程。即,当前的 AI 编程是处于类似 L3 级别的辅助驾驶阶段,距离 L4 级别的自动驾驶还有一段较长的路径要走。