标签语言模型下的文章

智能体来了从 0 到 1：如何判断一个流程是否值得交给智能体

作者: 纯情
时间: 2026-01-30
分类:
评论

在大模型从能力展示走向工程落地的过程中，智能体逐渐成为一种可被讨论、可被验证的系统形态。与此同时，一个现实问题开始反复出现：并非所有流程都适合智能体化。

在实际业务中，盲目引入智能体，往往带来的是推理成本上升、系统不稳定以及工程复杂度失控。因此，在“从 0 到 1”之前，建立一套判断流程是否值得交给智能体的评估框架，比选模型和堆工具更重要。

一、智能体适用范围的基本边界

从工程视角看，智能体并不是“更聪明的自动化”，而是一种以语言模型为核心控制器的非确定性执行系统。其价值不在于执行速度，而在于对复杂语义和动态决策的处理能力。

可以用一句话概括二者差异：

传统自动化：适用于输入明确、路径可穷举、结果必须确定的流程
智能体系统：适用于输入非结构化、路径需动态选择、过程允许纠偏的任务

当流程本身不存在“理解”和“选择”的空间时，引入智能体反而会放大不确定性。

二、判断流程是否适合智能体的三维标准

是否值得智能体化，可以从以下三个维度进行评估。

1. 输入与逻辑的非结构化程度

如果流程的输入是高度结构化数据，且处理逻辑可以被完整抽象为规则或算法，那么程序化系统的性价比更高。

智能体更具优势的场景通常包括：

需要理解自然语言、文档或混合信息
任务目标由文本描述而非参数定义
决策依赖大量非结构化知识的综合判断

当“理解成本”显著高于“执行成本”时，智能体才具备价值空间。

2. 决策路径的变动性

流程是否稳定，是判断智能体必要性的关键因素。

如果 90% 以上的执行路径固定，引入推理只会增加成本
如果每一步决策都依赖前一步结果或外部反馈，且分支难以穷举，智能体的动态规划能力才有意义

尤其是在需要根据搜索结果、接口返回或中间错误不断调整策略的场景中，规则系统的维护成本会快速上升。

3. 业务对非确定性的容忍度

智能体的输出本质上是概率性的，这一特征无法通过工程手段完全消除。

因此，流程是否适合智能体，取决于业务是否允许：

输出存在差异
过程需要人工确认或二次修正
错误可被发现并纠偏

在结果必须完全一致、错误代价极高的流程中，应优先选择确定性系统。

三、从行业实践中抽象出的共性判断点

在当前阶段，智能体来了这一现象更多体现为一种生产力结构变化，而非单点技术突破。从多个行业实践中，可以总结出三条共性判断准则。

1. 人工经验密集的流程断点

如果一个流程中，人的主要价值在于“阅读—判断—选择下一步系统操作”，那么这个位置往往是智能体的天然切入点。

当人只是做信息搬运，属于自动化问题；当人承担理解和决策角色，才是智能体能够产生效率溢价的地方。

2. 高频且难以标准化的任务

一次性或低频复杂任务，即便适合智能体，投入产出比也往往不成立。

更具价值的是：

高频发生
每次需求略有不同
无法通过配置化产品完全覆盖的长尾任务

这是传统软件最难处理、也是智能体最容易体现优势的区域。

3. 知识更新速度快于规则维护速度

当流程高度依赖外部知识，而这些知识变化频繁时，维护规则系统的成本会持续上升。

在此类场景中，结合检索机制的智能体系统，往往能以更低的维护成本实现持续对齐。

四、智能体化之前的风险过滤

在决定交给智能体之前，仍需进行基本的风险评估，包括：

是否涉及敏感数据与合规要求
是否存在严格的实时响应约束
模型推理成本是否真实覆盖了人力节省

智能体适合承担“决策辅助”与“复杂执行”，而不适合替代所有关键控制环节。

五、结论：判断标准比技术选型更重要

是否构建智能体，核心不在于模型能力，而在于流程本身的结构特征。

一个真正适合智能体的流程，通常具备：

非结构化输入与语义驱动逻辑
需要动态调整的决策路径
允许容错与人工校验的闭环机制
高频发生且知识密集

理性地识别这些特征，才能避免技术滥用，使智能体成为长期有效的生产力工具，而非短期概念叠加

我看ChatGPT: 为啥谷歌掉了千亿美金

作者: 纯情
时间: 2026-01-19
分类: 资讯
评论

两个月前，我试着想用 ChatGPT 帮我写篇文章《eBPF 介绍》，结果错误百出，导致我又要从头改一遍，从那天我觉得 ChatGPT 生成的内容完全不靠谱，所以，从那天开始我说我不会再用 ChatGPT 来写文章（这篇文章不是由 ChatGPT 生成），因为，在试过一段时间后，我对 ChatGTP 有基于如下的认识：

ChatGPT 不是基于事实，是基于语言模型的，事实对他来说不重要，对他重要的是他能读懂你的问题，并按照一定的套路回答你的问题。
因为是基于套路的回答，所以，他并不能保证内容是对的，他的目标是找到漂亮的精彩的套路，于是，你会发现，他的内容组织能力和表述还不错，但是只要你认真玩上一段时间，你会发现，ChatGPT 那些表述的套路其实也比较平常一般。它的很多回答其实都不深，只能在表面上。就像 Github 的 Copilot 一样，写不了什么高级的代码，只能帮你写一些常规格式化的代码（当然，这也够了）

ChatGPT 就是一个语言模型，如果不给他足够的数据和信息，它基本就是在胡编乱造

所以，基于上面这两个点认识，以发展的眼光来看问题，我觉得 ChatGPT 这类的 AI 可以成为一个小助理，他的确可以干掉那些初级的脑力工作者，但是，还干不掉专业的人士，这个我估计未来也很难，不过，这也很帅了，因为大量普通的工作的确也很让人费时间和精力，但是有个前提条件——就是ChatGPT所产生的内容必需是真实可靠的，没有这个前提条件的话，那就什么用也没有了。

今天，我想从另外一个角度来谈谈 ChatGPT，尤其是我在Youtube上看完了微软的发布会《Introducing your copilot for the web: AI-powered Bing and Microsoft Edge 》，才真正意识到Google 的市值为什么会掉了1000亿美元，是的，谷歌的搜索引擎的霸主位置受到了前所未有的挑战……

我们先来分析一下搜索引擎解决了什么样的用户问题，在我看来搜索引擎解决了如下的问题：

知识或信息索引。查新闻，查股票，查历史，查文档，找答案……
找服务提供商。找卖东西的电商，找帮你修东西的服务，找软件……
信息的准确和可靠。搜索引擎的rank算法保证了最准确、最有用、最权威的信息出现在最前面……（作恶的百度不在此列）

基本上就是上面这几个，搜索引擎在上面这几件事上作的很好，但是，还是有一些东西搜索引擎做的并不好，如：

搜索引擎是基于关键词的，不是基于语义的。所以，搜索引擎并不知道你的真实需求，因此，你会不可避免地要干下面的事，
- 你经常要不断地增加或调整不同的关键词来提高查询信息的准确度……
- 你经常要在你查找的信息中进行二次或多次过滤和筛选……
搜索引擎是只能呈现内容，无法解读内容。所以，你找到相关的链接后，你还要花大量的时间来阅读理解，经常性的你不可避免的要干下面的事：
- 打开一个链接，读到了一大半后，发现你要的内容不在其中，只能关掉再打开一个……
- 你想要的内容是在的，但是太晦涩，看不懂，太费解，你要找小白友好的版本……
- 你想要的内容不完整，你需要在很多个链接和网页上做拼图游戏……
- 内容是无法结构化的展示的，你搜到的东西全都是碎片信息
搜索引擎没有上下文关联，两次搜索是没有关系的。也就是说，人知道的越多，问题也就越多，所以，我们经常会面临下面的问题：
- 随着我了解的越多，我的信息搜索的会出现分支，这个分支只有我自己的管理，搜索引擎是不关心的，导致我每次都相当于从头开始……
- 你做计划的时候，你需要从多个不同的搜索中获取你想要的东西，最终组合成你定制化的东西，比如做旅游计划……

好了，我们知道，ChatGPT 这类的技术主要是用来根据用户的需求来按一定的套路来“生成内容”的，只是其中的内容并不怎么可靠，那么，如果把搜索引擎里靠谱的内容交给 ChatGPT 呢？那么，这会是一个多么强大的搜索引擎啊，完全就是下一代的搜索引擎，上面的那些问题完全都可以解决了：

你可以打一段话给搜索引擎，ChatGPT 是读得懂语义的。
因为知道语义，于是在众多搜过结果中，他更知道哪些是你想要的内容。
ChatGPT 可以帮你生成 TL;DR，把长文中的要求总结出来形成更易读的短文
ChatGPT 可以帮你整理内容，在多个网页中帮你整合和结构化内容
ChatGPT 可以有上下文对话，你可以让他帮你不断通过更多的关键词搜索信息，并在同一个主题下生成、组织和优化内容

一旦 ChatGPT 利用上了搜索引擎内容准确和靠谱的优势，那么，ChatGPT 的能力就完全被释放出来了，所以，带 ChatGPT 的搜索引擎，就是真正的“如虎添翼”！

因此，微软的 Bing + ChatGPT，成为了 Google 有史以来最大的挑战者，我感觉——所有跟信息或是文字处理相关的软件应用和服务，都会因为 ChatGPT 而且全部重新洗一次牌的，这应该会是新一轮的技术革命……Copilot 一定会成为下一代软件和应用的标配！

Sebastian Raschka 2026预测：Transformer统治依旧，但扩散模型正悄然崛起｜

作者: 纯情
时间: 2026-01-14
分类: 资讯
评论

Sebastian Raschka 2026预测：Transformer统治依旧，但扩散模型正悄然崛起

0%

展开列表

Sebastian Raschka 2026预测：Transformer统治依旧，但扩散模型正悄然崛起

今天

端到端智驾新SOTA | KnowVal：懂法律道德、有价值观的智能驾驶系统

今天

仅用10天？Anthropic最新智能体Cowork的代码竟然都是Claude写的

今天

AAAI 2026｜AP2O-Coder 让大模型拥有「错题本」，像人类一样按题型高效刷题

今天

用AI从常规病理切片重建空间蛋白图谱：基于H&E图像的高维蛋白质表达预测

今天

京东首届AI影视创作大赛启动最高奖金10万元邀全民共创AI视频

今天

合合信息多模态文本智能产品“上新”，覆盖AI教育、AI健康、AI Infra多元场景

今天

500万次围观，1X把「世界模型」真正用在了机器人NEO身上

今天

跳出「黑盒」，人大刘勇团队最新大语言模型理论与机理综述

今天

百川开源全球最强医疗大模型M3，「严肃问诊」定义AI医疗新能力

今天

相约AAAI 2026 | 上海AI实验室北极星 X 星启交流会（报名开启）

01月13日

视觉模型既懂语义，又能还原细节，南洋理工&商汤提出棱镜假说

01月13日

无需重新训练，即可学习新任务，Arc研究所开源单细胞基础模型Stack及细胞反应全景图谱

01月13日

不上云、不租卡，如何优雅地在本地微调Qwen-VL-30B？

01月13日

OpenAI的首款硬件：是AI耳机，今年销量要冲5000万

01月13日

华为推出软工代码智能体SWE-Lego，解锁SFT训练极致性能

01月13日

大模型中标TOP10里的黑马：中关村科金的应用攻坚之道

01月13日

刚刚，梁文锋署名开源「记忆」模块，DeepSeek V4更细节了

01月13日

一个模型统一4D世界生成与重建，港科大One4D框架来了

01月13日

端到端智驾的算力困局，九章智算云这样破局

01月12日

Sebastian Raschka 2026预测：Transformer统治依旧，但扩散模型正悄然崛起

站在 2026 年的开端回望，LLM 的架构之争似乎进入了一个新的微妙阶段。过去几年，Transformer 架构以绝对的统治力横扫了人工智能领域，但随着算力成本的博弈和对推理效率的极致追求，挑战者们从未停止过脚步。

知名 AI 研究员 Sebastian Raschka 的最新洞察中，他不仅回应了关于「Transformer 是否会被取代」的年度终极之问，更敏锐地捕捉到了近期业界的一个重要转向：从单纯追求模型参数的「大力出奇迹」，转向了混合架构与效率微调的精细化战争。

同时，文章还探讨了一个极具潜力的变量：扩散语言模型。这类模型在 Google 等巨头的布局下会有怎样的表现？它们在「工具调用」上的天然缺陷是否会成为阿喀琉斯之踵？而在高质量数据日益枯竭的今天，扩散模型又是否能凭借「超级数据学习者」的特性，成为打破数据墙的关键？

以下内容编译自 Sebastian Raschka 的最新博文，并结合文中提及的前沿论文及往期深度分析进行了系统性拓展，以便读者获取更完整的上下文视角。

博客地址：https://x.com/rasbt/status/2010376305720594810

最近几周，我经常被问到的一个问题是：在 2026 年，我们是否会看到自回归 Transformer 架构（即标准的 LLM）的替代方案。

就目前而言，我坚信 Transformer 在未来（至少一到几年内）仍将保持其在 SOTA 性能方面的地位。它是当前 AI 生态系统的基石，拥有最成熟的工具链和优化方案。

但是，情况确实会发生一些微调。这并不是说架构会一成不变，而是这种变化更多体现在「效率」和「混合」上，而非彻底的推倒重来。

效率战争：混合架构与线性注意力的崛起

临近去年年底，我们看到业界更加关注混合架构以及如何提高其效率。当然，这并不是什么新想法，但近期来自顶尖实验室的发布表明，目前的侧重点已明显向此倾斜。

我们回顾一下 DeepSeek V3 以及随后的 R1，它们展示了混合专家模型（MoE）和多头潜在注意力（MLA）的强大之处。DeepSeek V3 通过 MLA 显著减少了推理时的 KV Cache 占用，而 MoE 架构则允许模型在拥有 6710 亿参数的同时，每次推理仅激活 370 亿参数。这种在保持模型巨大容量的同时极致压缩推理成本的设计思路，正是 2025 年末到 2026 年的主旋律。

但这还不是全部。除了 MoE，我们看到了更激进的效率尝试，例如 Qwen3-Next、Kimi Linear、Nvidia Nemotron 3，以及采用了稀疏注意力机制的 DeepSeek V3.2。（如果您对更多细节感兴趣，我在之前的《Big LLM Architecture Comparison》一文中对此进行了报道。）

^{带有这类效率调整的 Transformer 架构示意图。}

相关链接：https://magazine.sebastianraschka.com/p/the-big-llm-architecture-comparison

为什么大家都在卷「线性注意力」或「稀疏注意力」？

标准的 Transformer 注意力机制（Scaled Dot-Product Attention）具有 O(N^2) 的复杂度，这意味着随着上下文长度的增加，计算成本呈二次方爆炸式增长。

Qwen3-Next 和 Kimi Linear 采用了一种混合策略：它们并非完全抛弃标准注意力，而是将高效的线性层（如 Gated DeltaNet）与全注意力层以一定比例（如 3:1）混合。这种设计试图在捕捉长距离依赖（全注意力的强项）和推理速度（线性层的强项）之间找到最佳平衡点。
DeepSeek V3.2 则引入了稀疏注意力，通过只计算最重要的 Token 之间的相互作用，进一步降低了计算开销。

这些「微调」表明，2026 年的竞争不再仅仅是看谁的模型更聪明，而是看谁能在更长的上下文、更低的延迟下提供同等的智能。

扩散语言模型：速度与代价的博弈

话说回来，除了 Transformer 的变体，扩散语言模型怎么样？

扩散语言模型之所以具有吸引力，是因为它们能够以相对快速且低廉的成本生成 Token。与自回归模型（AR）那种「一个字接一个字」的串行生成不同，扩散模型采用的是并行生成。

想象一下，自回归模型像是一个人在打字，必须打完上一个字才能打下一个；而扩散模型更像是在冲洗一张照片，整段文字从模糊的噪声中同时显现，经过数次「去噪」迭代后变得清晰。

我前阵子在《Beyond Standard LLMs》一文中对此多写了一些。简而言之，我认为 2026 年我们会看到更多相关内容，Google 可能会推出 Gemini Diffusion 作为其更便宜的 Flash 模型的替代品。Google 已经在其技术博客中暗示了这一点，强调其生成速度「明显快于我们目前最快的模型」。

相关链接：https://magazine.sebastianraschka.com/p/beyond-standard-llms

然而，虽然扩散语言模型的优势在于它们可以并行生成 Token，但这同时也是一个巨大的缺点。因为由于并行生成的特性，它们无法在响应链中原生地整合工具调用。

在自回归模型中，模型可以生成「调用计算器」的指令，暂停，等待结果，然后再继续生成。而在扩散模型中，整个响应是同时生成的，很难在中间插入一个外部工具的交互步骤。这使得它们在作为智能体使用时面临巨大挑战。

^{文本扩散过程示例。}

此外，虽然众所周知文本扩散推理效率更高，但最近的研究也表明，如果你为了提升质量而增加去噪步数以匹配自回归模型的性能，那么最终的计算预算其实是相差无几的。

数据枯竭时代的「超级学习者」

那么，我想表达什么呢？既然扩散模型有这些缺陷，为什么我还认为它值得关注？

我原本计划讨论一月份发布的近期一系列有趣的研究，但我还是想简要重点介绍一篇我在「待读论文」清单上的、2025 年 11 月的有趣论文，它强调了扩散语言模型的一个有趣优势：《Diffusion Language Models are Super Data Learners》。

论文地址：https://arxiv.org/abs/2511.03276

^{来自论文《Diffusion Language Models are Super Data Learners》的带注释图表。}

这篇论文提出了一个在 2026 年至关重要的观点：当高质量数据变得稀缺时，扩散模型可能是更好的学习者。

众所周知，互联网上的高质量文本数据正在接近枯竭。对于自回归（AR）模型来说，通常我们只让模型把数据「看」一遍（1 Epoch）。如果让 AR 模型反复在同一份数据上训练，它们很容易过拟合，即死记硬背训练数据，导致在未见过的新任务上表现下降。

然而，上述论文表明，当进行多 Epoch 训练时，文本扩散模型的表现可能优于标准的自回归（AR）大语言模型。

根据论文的研究结果，在严格控制的预训练设置下，当唯一数据量有限时，通过增加训练轮数，扩散语言模型的表现持续超越了自回归模型。

这一现象被称为「Crossover（交叉点）」：

当数据量充足时，AR 模型学得更快。
但当数据受限时，DLM 是最终的赢家。例如，一个 10 亿参数的 DLM 模型，仅仅通过反复训练 10 亿个 Token（这在今天看是非常小的数据量），在 HellaSwag 和 MMLU 基准测试上分别达到了 >56% 和 >33% 的准确率，且没有使用任何特殊技巧。

为什么会这样？论文归结为三个因素：

任意顺序建模：AR 模型被迫只能从左到右学习，而扩散模型可以学习文本中任意位置之间的依赖关系。
超高密度计算：通过迭代的双向去噪，DLM 在训练时实际上对每个样本进行了更深度的压榨。
内置的蒙特卡洛增强：扩散过程本身就是一种数据增强。同一个句子，每次加噪的方式都不一样，相当于把一条数据变成了无数条变体。

更有趣的是，论文发现，对于 DLM 来说，验证集损失的上升并不意味着下游能力的下降。即便模型在验证集上看起来「过拟合」了，它在实际任务（如代码生成、推理）上的表现仍在提升。

由于成本原因，过去没有人会在多个 Epoch 上训练大语言模型。但在数据枯竭的今天，如果我们不得不进行多 Epoch 训练，扩散模型似乎提供了一条新出路。

这确实是有趣的结果！

我看ChatGPT: 为啥谷歌掉了千亿美金

作者: 纯情
时间: 2026-01-14
分类: 资讯
评论

两个月前，我试着想用 ChatGPT 帮我写篇文章《eBPF 介绍》，结果错误百出，导致我又要从头改一遍，从那天我觉得 ChatGPT 生成的内容完全不靠谱，所以，从那天开始我说我不会再用 ChatGPT 来写文章（这篇文章不是由 ChatGPT 生成），因为，在试过一段时间后，我对 ChatGTP 有基于如下的认识：

ChatGPT 不是基于事实，是基于语言模型的，事实对他来说不重要，对他重要的是他能读懂你的问题，并按照一定的套路回答你的问题。
因为是基于套路的回答，所以，他并不能保证内容是对的，他的目标是找到漂亮的精彩的套路，于是，你会发现，他的内容组织能力和表述还不错，但是只要你认真玩上一段时间，你会发现，ChatGPT 那些表述的套路其实也比较平常一般。它的很多回答其实都不深，只能在表面上。就像 Github 的 Copilot 一样，写不了什么高级的代码，只能帮你写一些常规格式化的代码（当然，这也够了）

所以，基于上面这两个点认识，以发展的眼光来看问题，我觉得 ChatGPT 这类的 AI 可以成为一个小助理，他的确可以干掉那些初级的脑力工作者，但是，还干不掉专业的人士，这个我估计未来也很难，不过，这也很帅了，因为大量普通的工作的确也很让人费时间和精力，但是有个前提条件——就是ChatGPT所产生的内容必需是真实可靠的，没有这个前提条件的话，那就什么用也没有了。

今天，我想从另外一个角度来谈谈 ChatGPT，尤其是我在Youtube上看完了微软的发布会《Introducing your copilot for the web: AI-powered Bing and Microsoft Edge 》，才真正意识到Google 的市值为什么会掉了1000亿美元，是的，谷歌的搜索引擎的霸主位置受到了前所未有的挑战……

我们先来分析一下搜索引擎解决了什么样的用户问题，在我看来搜索引擎解决了如下的问题：

知识或信息索引。查新闻，查股票，查历史，查文档，找答案……
找服务提供商。找卖东西的电商，找帮你修东西的服务，找软件……
信息的准确和可靠。搜索引擎的rank算法保证了最准确、最有用、最权威的信息出现在最前面……（作恶的百度不在此列）

基本上就是上面这几个，搜索引擎在上面这几件事上作的很好，但是，还是有一些东西搜索引擎做的并不好，如：

搜索引擎是基于关键词的，不是基于语义的。所以，搜索引擎并不知道你的真实需求，因此，你会不可避免地要干下面的事，
- 你经常要不断地增加或调整不同的关键词来提高查询信息的准确度……
- 你经常要在你查找的信息中进行二次或多次过滤和筛选……
搜索引擎是只能呈现内容，无法解读内容。所以，你找到相关的链接后，你还要花大量的时间来阅读理解，经常性的你不可避免的要干下面的事：
- 打开一个链接，读到了一大半后，发现你要的内容不在其中，只能关掉再打开一个……
- 你想要的内容是在的，但是太晦涩，看不懂，太费解，你要找小白友好的版本……
- 你想要的内容不完整，你需要在很多个链接和网页上做拼图游戏……
- 内容是无法结构化的展示的，你搜到的东西全都是碎片信息
搜索引擎没有上下文关联，两次搜索是没有关系的。也就是说，人知道的越多，问题也就越多，所以，我们经常会面临下面的问题：
- 随着我了解的越多，我的信息搜索的会出现分支，这个分支只有我自己的管理，搜索引擎是不关心的，导致我每次都相当于从头开始……
- 你做计划的时候，你需要从多个不同的搜索中获取你想要的东西，最终组合成你定制化的东西，比如做旅游计划……

好了，我们知道，ChatGPT 这类的技术主要是用来根据用户的需求来按一定的套路来“生成内容”的，只是其中的内容并不怎么可靠，那么，如果把搜索引擎里靠谱的内容交给 ChatGPT 呢？那么，这会是一个多么强大的搜索引擎啊，完全就是下一代的搜索引擎，上面的那些问题完全都可以解决了：

你可以打一段话给搜索引擎，ChatGPT 是读得懂语义的。
因为知道语义，于是在众多搜过结果中，他更知道哪些是你想要的内容。
ChatGPT 可以帮你生成 TL;DR，把长文中的要求总结出来形成更易读的短文
ChatGPT 可以帮你整理内容，在多个网页中帮你整合和结构化内容
ChatGPT 可以有上下文对话，你可以让他帮你不断通过更多的关键词搜索信息，并在同一个主题下生成、组织和优化内容

一旦 ChatGPT 利用上了搜索引擎内容准确和靠谱的优势，那么，ChatGPT 的能力就完全被释放出来了，所以，带 ChatGPT 的搜索引擎，就是真正的“如虎添翼”！

因此，微软的 Bing + ChatGPT，成为了 Google 有史以来最大的挑战者，我感觉——所有跟信息或是文字处理相关的软件应用和服务，都会因为 ChatGPT 而且全部重新洗一次牌的，这应该会是新一轮的技术革命……Copilot 一定会成为下一代软件和应用的标配！

我看ChatGPT: 为啥谷歌掉了千亿美金

作者: 纯情
时间: 2026-01-09
分类: 资讯
评论

两个月前，我试着想用 ChatGPT 帮我写篇文章《eBPF 介绍》，结果错误百出，导致我又要从头改一遍，从那天我觉得 ChatGPT 生成的内容完全不靠谱，所以，从那天开始我说我不会再用 ChatGPT 来写文章（这篇文章不是由 ChatGPT 生成），因为，在试过一段时间后，我对 ChatGTP 有基于如下的认识：

ChatGPT 不是基于事实，是基于语言模型的，事实对他来说不重要，对他重要的是他能读懂你的问题，并按照一定的套路回答你的问题。
因为是基于套路的回答，所以，他并不能保证内容是对的，他的目标是找到漂亮的精彩的套路，于是，你会发现，他的内容组织能力和表述还不错，但是只要你认真玩上一段时间，你会发现，ChatGPT 那些表述的套路其实也比较平常一般。它的很多回答其实都不深，只能在表面上。就像 Github 的 Copilot 一样，写不了什么高级的代码，只能帮你写一些常规格式化的代码（当然，这也够了）

所以，基于上面这两个点认识，以发展的眼光来看问题，我觉得 ChatGPT 这类的 AI 可以成为一个小助理，他的确可以干掉那些初级的脑力工作者，但是，还干不掉专业的人士，这个我估计未来也很难，不过，这也很帅了，因为大量普通的工作的确也很让人费时间和精力，但是有个前提条件——就是ChatGPT所产生的内容必需是真实可靠的，没有这个前提条件的话，那就什么用也没有了。

今天，我想从另外一个角度来谈谈 ChatGPT，尤其是我在Youtube上看完了微软的发布会《Introducing your copilot for the web: AI-powered Bing and Microsoft Edge 》，才真正意识到Google 的市值为什么会掉了1000亿美元，是的，谷歌的搜索引擎的霸主位置受到了前所未有的挑战……

我们先来分析一下搜索引擎解决了什么样的用户问题，在我看来搜索引擎解决了如下的问题：

知识或信息索引。查新闻，查股票，查历史，查文档，找答案……
找服务提供商。找卖东西的电商，找帮你修东西的服务，找软件……
信息的准确和可靠。搜索引擎的rank算法保证了最准确、最有用、最权威的信息出现在最前面……（作恶的百度不在此列）

基本上就是上面这几个，搜索引擎在上面这几件事上作的很好，但是，还是有一些东西搜索引擎做的并不好，如：

搜索引擎是基于关键词的，不是基于语义的。所以，搜索引擎并不知道你的真实需求，因此，你会不可避免地要干下面的事，
- 你经常要不断地增加或调整不同的关键词来提高查询信息的准确度……
- 你经常要在你查找的信息中进行二次或多次过滤和筛选……
搜索引擎是只能呈现内容，无法解读内容。所以，你找到相关的链接后，你还要花大量的时间来阅读理解，经常性的你不可避免的要干下面的事：
- 打开一个链接，读到了一大半后，发现你要的内容不在其中，只能关掉再打开一个……
- 你想要的内容是在的，但是太晦涩，看不懂，太费解，你要找小白友好的版本……
- 你想要的内容不完整，你需要在很多个链接和网页上做拼图游戏……
- 内容是无法结构化的展示的，你搜到的东西全都是碎片信息
搜索引擎没有上下文关联，两次搜索是没有关系的。也就是说，人知道的越多，问题也就越多，所以，我们经常会面临下面的问题：
- 随着我了解的越多，我的信息搜索的会出现分支，这个分支只有我自己的管理，搜索引擎是不关心的，导致我每次都相当于从头开始……
- 你做计划的时候，你需要从多个不同的搜索中获取你想要的东西，最终组合成你定制化的东西，比如做旅游计划……

好了，我们知道，ChatGPT 这类的技术主要是用来根据用户的需求来按一定的套路来“生成内容”的，只是其中的内容并不怎么可靠，那么，如果把搜索引擎里靠谱的内容交给 ChatGPT 呢？那么，这会是一个多么强大的搜索引擎啊，完全就是下一代的搜索引擎，上面的那些问题完全都可以解决了：

你可以打一段话给搜索引擎，ChatGPT 是读得懂语义的。
因为知道语义，于是在众多搜过结果中，他更知道哪些是你想要的内容。
ChatGPT 可以帮你生成 TL;DR，把长文中的要求总结出来形成更易读的短文
ChatGPT 可以帮你整理内容，在多个网页中帮你整合和结构化内容
ChatGPT 可以有上下文对话，你可以让他帮你不断通过更多的关键词搜索信息，并在同一个主题下生成、组织和优化内容

一旦 ChatGPT 利用上了搜索引擎内容准确和靠谱的优势，那么，ChatGPT 的能力就完全被释放出来了，所以，带 ChatGPT 的搜索引擎，就是真正的“如虎添翼”！

因此，微软的 Bing + ChatGPT，成为了 Google 有史以来最大的挑战者，我感觉——所有跟信息或是文字处理相关的软件应用和服务，都会因为 ChatGPT 而且全部重新洗一次牌的，这应该会是新一轮的技术革命……Copilot 一定会成为下一代软件和应用的标配！

我看ChatGPT: 为啥谷歌掉了千亿美金

作者: 纯情
时间: 2026-01-05
分类: 资讯
评论

两个月前，我试着想用 ChatGPT 帮我写篇文章《eBPF 介绍》，结果错误百出，导致我又要从头改一遍，从那天我觉得 ChatGPT 生成的内容完全不靠谱，所以，从那天开始我说我不会再用 ChatGPT 来写文章（这篇文章不是由 ChatGPT 生成），因为，在试过一段时间后，我对 ChatGTP 有基于如下的认识：

ChatGPT 不是基于事实，是基于语言模型的，事实对他来说不重要，对他重要的是他能读懂你的问题，并按照一定的套路回答你的问题。
因为是基于套路的回答，所以，他并不能保证内容是对的，他的目标是找到漂亮的精彩的套路，于是，你会发现，他的内容组织能力和表述还不错，但是只要你认真玩上一段时间，你会发现，ChatGPT 那些表述的套路其实也比较平常一般。它的很多回答其实都不深，只能在表面上。就像 Github 的 Copilot 一样，写不了什么高级的代码，只能帮你写一些常规格式化的代码（当然，这也够了）

所以，基于上面这两个点认识，以发展的眼光来看问题，我觉得 ChatGPT 这类的 AI 可以成为一个小助理，他的确可以干掉那些初级的脑力工作者，但是，还干不掉专业的人士，这个我估计未来也很难，不过，这也很帅了，因为大量普通的工作的确也很让人费时间和精力，但是有个前提条件——就是ChatGPT所产生的内容必需是真实可靠的，没有这个前提条件的话，那就什么用也没有了。

今天，我想从另外一个角度来谈谈 ChatGPT，尤其是我在Youtube上看完了微软的发布会《Introducing your copilot for the web: AI-powered Bing and Microsoft Edge 》，才真正意识到Google 的市值为什么会掉了1000亿美元，是的，谷歌的搜索引擎的霸主位置受到了前所未有的挑战……

我们先来分析一下搜索引擎解决了什么样的用户问题，在我看来搜索引擎解决了如下的问题：

知识或信息索引。查新闻，查股票，查历史，查文档，找答案……
找服务提供商。找卖东西的电商，找帮你修东西的服务，找软件……
信息的准确和可靠。搜索引擎的rank算法保证了最准确、最有用、最权威的信息出现在最前面……（作恶的百度不在此列）

基本上就是上面这几个，搜索引擎在上面这几件事上作的很好，但是，还是有一些东西搜索引擎做的并不好，如：

搜索引擎是基于关键词的，不是基于语义的。所以，搜索引擎并不知道你的真实需求，因此，你会不可避免地要干下面的事，
- 你经常要不断地增加或调整不同的关键词来提高查询信息的准确度……
- 你经常要在你查找的信息中进行二次或多次过滤和筛选……
搜索引擎是只能呈现内容，无法解读内容。所以，你找到相关的链接后，你还要花大量的时间来阅读理解，经常性的你不可避免的要干下面的事：
- 打开一个链接，读到了一大半后，发现你要的内容不在其中，只能关掉再打开一个……
- 你想要的内容是在的，但是太晦涩，看不懂，太费解，你要找小白友好的版本……
- 你想要的内容不完整，你需要在很多个链接和网页上做拼图游戏……
- 内容是无法结构化的展示的，你搜到的东西全都是碎片信息
搜索引擎没有上下文关联，两次搜索是没有关系的。也就是说，人知道的越多，问题也就越多，所以，我们经常会面临下面的问题：
- 随着我了解的越多，我的信息搜索的会出现分支，这个分支只有我自己的管理，搜索引擎是不关心的，导致我每次都相当于从头开始……
- 你做计划的时候，你需要从多个不同的搜索中获取你想要的东西，最终组合成你定制化的东西，比如做旅游计划……

好了，我们知道，ChatGPT 这类的技术主要是用来根据用户的需求来按一定的套路来“生成内容”的，只是其中的内容并不怎么可靠，那么，如果把搜索引擎里靠谱的内容交给 ChatGPT 呢？那么，这会是一个多么强大的搜索引擎啊，完全就是下一代的搜索引擎，上面的那些问题完全都可以解决了：

你可以打一段话给搜索引擎，ChatGPT 是读得懂语义的。
因为知道语义，于是在众多搜过结果中，他更知道哪些是你想要的内容。
ChatGPT 可以帮你生成 TL;DR，把长文中的要求总结出来形成更易读的短文
ChatGPT 可以帮你整理内容，在多个网页中帮你整合和结构化内容
ChatGPT 可以有上下文对话，你可以让他帮你不断通过更多的关键词搜索信息，并在同一个主题下生成、组织和优化内容

一旦 ChatGPT 利用上了搜索引擎内容准确和靠谱的优势，那么，ChatGPT 的能力就完全被释放出来了，所以，带 ChatGPT 的搜索引擎，就是真正的“如虎添翼”！

因此，微软的 Bing + ChatGPT，成为了 Google 有史以来最大的挑战者，我感觉——所有跟信息或是文字处理相关的软件应用和服务，都会因为 ChatGPT 而且全部重新洗一次牌的，这应该会是新一轮的技术革命……Copilot 一定会成为下一代软件和应用的标配！

我看ChatGPT: 为啥谷歌掉了千亿美金

作者: 纯情
时间: 2026-01-04
分类: 资讯
评论

两个月前，我试着想用 ChatGPT 帮我写篇文章《eBPF 介绍》，结果错误百出，导致我又要从头改一遍，从那天我觉得 ChatGPT 生成的内容完全不靠谱，所以，从那天开始我说我不会再用 ChatGPT 来写文章（这篇文章不是由 ChatGPT 生成），因为，在试过一段时间后，我对 ChatGTP 有基于如下的认识：

ChatGPT 不是基于事实，是基于语言模型的，事实对他来说不重要，对他重要的是他能读懂你的问题，并按照一定的套路回答你的问题。
因为是基于套路的回答，所以，他并不能保证内容是对的，他的目标是找到漂亮的精彩的套路，于是，你会发现，他的内容组织能力和表述还不错，但是只要你认真玩上一段时间，你会发现，ChatGPT 那些表述的套路其实也比较平常一般。它的很多回答其实都不深，只能在表面上。就像 Github 的 Copilot 一样，写不了什么高级的代码，只能帮你写一些常规格式化的代码（当然，这也够了）

所以，基于上面这两个点认识，以发展的眼光来看问题，我觉得 ChatGPT 这类的 AI 可以成为一个小助理，他的确可以干掉那些初级的脑力工作者，但是，还干不掉专业的人士，这个我估计未来也很难，不过，这也很帅了，因为大量普通的工作的确也很让人费时间和精力，但是有个前提条件——就是ChatGPT所产生的内容必需是真实可靠的，没有这个前提条件的话，那就什么用也没有了。

今天，我想从另外一个角度来谈谈 ChatGPT，尤其是我在Youtube上看完了微软的发布会《Introducing your copilot for the web: AI-powered Bing and Microsoft Edge 》，才真正意识到Google 的市值为什么会掉了1000亿美元，是的，谷歌的搜索引擎的霸主位置受到了前所未有的挑战……

我们先来分析一下搜索引擎解决了什么样的用户问题，在我看来搜索引擎解决了如下的问题：

知识或信息索引。查新闻，查股票，查历史，查文档，找答案……
找服务提供商。找卖东西的电商，找帮你修东西的服务，找软件……
信息的准确和可靠。搜索引擎的rank算法保证了最准确、最有用、最权威的信息出现在最前面……（作恶的百度不在此列）

基本上就是上面这几个，搜索引擎在上面这几件事上作的很好，但是，还是有一些东西搜索引擎做的并不好，如：

搜索引擎是基于关键词的，不是基于语义的。所以，搜索引擎并不知道你的真实需求，因此，你会不可避免地要干下面的事，
- 你经常要不断地增加或调整不同的关键词来提高查询信息的准确度……
- 你经常要在你查找的信息中进行二次或多次过滤和筛选……
搜索引擎是只能呈现内容，无法解读内容。所以，你找到相关的链接后，你还要花大量的时间来阅读理解，经常性的你不可避免的要干下面的事：
- 打开一个链接，读到了一大半后，发现你要的内容不在其中，只能关掉再打开一个……
- 你想要的内容是在的，但是太晦涩，看不懂，太费解，你要找小白友好的版本……
- 你想要的内容不完整，你需要在很多个链接和网页上做拼图游戏……
- 内容是无法结构化的展示的，你搜到的东西全都是碎片信息
搜索引擎没有上下文关联，两次搜索是没有关系的。也就是说，人知道的越多，问题也就越多，所以，我们经常会面临下面的问题：
- 随着我了解的越多，我的信息搜索的会出现分支，这个分支只有我自己的管理，搜索引擎是不关心的，导致我每次都相当于从头开始……
- 你做计划的时候，你需要从多个不同的搜索中获取你想要的东西，最终组合成你定制化的东西，比如做旅游计划……

好了，我们知道，ChatGPT 这类的技术主要是用来根据用户的需求来按一定的套路来“生成内容”的，只是其中的内容并不怎么可靠，那么，如果把搜索引擎里靠谱的内容交给 ChatGPT 呢？那么，这会是一个多么强大的搜索引擎啊，完全就是下一代的搜索引擎，上面的那些问题完全都可以解决了：

你可以打一段话给搜索引擎，ChatGPT 是读得懂语义的。
因为知道语义，于是在众多搜过结果中，他更知道哪些是你想要的内容。
ChatGPT 可以帮你生成 TL;DR，把长文中的要求总结出来形成更易读的短文
ChatGPT 可以帮你整理内容，在多个网页中帮你整合和结构化内容
ChatGPT 可以有上下文对话，你可以让他帮你不断通过更多的关键词搜索信息，并在同一个主题下生成、组织和优化内容

一旦 ChatGPT 利用上了搜索引擎内容准确和靠谱的优势，那么，ChatGPT 的能力就完全被释放出来了，所以，带 ChatGPT 的搜索引擎，就是真正的“如虎添翼”！

因此，微软的 Bing + ChatGPT，成为了 Google 有史以来最大的挑战者，我感觉——所有跟信息或是文字处理相关的软件应用和服务，都会因为 ChatGPT 而且全部重新洗一次牌的，这应该会是新一轮的技术革命……Copilot 一定会成为下一代软件和应用的标配！

（全文完）

（转载本站文章请注明作者和出处酷壳 – CoolShell ，请勿用于任何商业用途）

好烂啊有点差凑合看看还不错很精彩 (255 人打了分，平均分： 4.52 )

Loading...