JeecgBoot AI专题研究 | 用 DeepSeek V4 几乎完美替代 Claude,唯一卡点就是不收图——这块短板马上要补上

一句话先说结论

DeepSeek V4 系列上线一周多,密集跑下来,Claude Code 接 DeepSeek V4-Pro 已经能完美替代原生 Claude 跑日常开发:写代码、改 bug、跑 Skills、生成报表大屏、自动化部署,全部丝滑。唯一让人难受的短板就是 V4 还不收图——架构图、设计稿、错误截图扔不进去,只能切回 Claude。

好消息是:4 月 29 日 DeepSeek 已经在 Web 端灰度推送识图模式,这块短板很快就要被补齐。如果你和我一样在用 Claude Code + DeepSeek 的组合,再忍两周,体验就会齐活。


这一周用下来:DeepSeek V4 真的能替代 Claude

我之前写过一篇 Claude Code + DeepSeek V4-Pro 真实评测,结论是"除了贵,没别的毛病"。这几天密集再压一轮,结论要更乐观一些——贵的问题随着用量上来已经被摊平了,稳定性反而是最大的安慰

具体替代效果分几条说:

① 代码生成与重构:基本无感切换

跑 JeecgBoot 的 Skills 生态——OA 流程自动搭建、积木 BI 大屏生成、钻取报表、自动化部署、Online 表单——这些场景下 DeepSeek V4-Pro 的输出质量和 Claude Sonnet 4.6 几乎打成平手。长上下文不掉链、工具调用准确率高、JSON 结构稳定,是工程化最看重的三个指标。

② 工具调用与 Skills 执行:兼容性满分

Anthropic 协议兼容层做得很到位,Claude Code 那一套 tools / tool_choice / tool_use 字段不需要改任何代码,直接换个 base URL 就能跑。Skills 执行链路里那些复杂的 nested tool call、多轮迭代修正、stream 模式,全部无缝

③ 账号稳定性:真正的解放

这条本来排不到这么靠前,但最近半年 Claude 账号批量被封的消息一波接一波,身边的同事中招的不少。DeepSeek 是国内主体、计费透明、合规清晰,再不用每天担心一觉醒来号没了——光这一条就值回票价。

④ 成本:日常开销降到 1/5

Opus 4.6 输入价 $15/百万 tokens,DeepSeek V4-Pro 是 ¥4/百万 tokens 左右(折合不到 $0.6),输入端便宜 25 倍以上。一天写 200 万 token 的开发者,月度账单从四位数美金降到三位数人民币,企业用量更明显。


那个让人坐立不安的"唯一短板":DeepSeek V4 不收图

舒服归舒服,但只要任务一旦涉及"看一眼这张图给点意见",DeepSeek 就立刻举手投降。

模型收到截图后,在界面上诚实地打印出一行字:

没错------它看不见图片

V4-Pro 当前版本是纯文本模型,完全不支持图片输入。

Claude Code 在发送图片时,V4-Pro 会收到一个占位符 [Image #1],但对实际图像内容毫无感知。所以你看到的那句"我无法直接查看图片"不是谦虚,是真的看不见。

对于日常编程工作流,这个限制影响面相当广:

  • 截图报错让模型分析 → ❌ 看不见
  • 发 UI 设计稿让模型写代码 → ❌ 看不见
  • 发报表渲染结果让模型诊断问题 → ❌ 看不见
  • 粘贴终端截图 → ❌ 看不见

社区里催识图能力的帖子从去年下半年到现在没断过,DeepSeek 团队也在 GitHub Issues 里多次回复"在做了在做了"。这次灰度上线,算是把欠了一年多的功课正式补上。

4 月 29 日的灰度推送:识图模式正式登场

灰度入口出现在 DeepSeek Web 端聊天框左下角的功能区,多了一个"识图"开关。开启后输入框右侧会出现回形针图标,可以直接拖拽或粘贴图片。API 端目前还没看到对应字段,但根据通常的灰度节奏,预计两周内会同步开放给 Pro 用户——这才是 Claude Code 用户真正等的那一天。

不是凭空出现:那些被忽略的多模态铺垫

很多人以为 DeepSeek 之前一直只做文本,识图能力是凭空冒出来。其实早就有伏笔,只是声量没那么大:

  • 2024 年 12 月 · DeepSeek-VL2:开源 MoE 架构多模态模型,3 个尺寸(3B / 16B / 27B 激活),覆盖通用视觉任务
  • 2025 年初 · Janus:统一视觉理解与生成的双流架构,解耦 encoder,生图与读图共享主干
  • 2025 年 · JanusFlow:引入 Rectified Flow 训练范式,被 CVPR 2025 主会议收录
  • 2025 年 · Janus-Pro:在 GenEval 基准上超越 DALL·E 3 与 Stable Diffusion,进入 SOTA 第一梯队

也就是说,DeepSeek 在多模态这条线上一直在砸论文和开源模型,缺的只是把它装进 Chat 主入口和 API 这一脚。这次灰度推送,本质上是把研究侧的能力正式产品化。

之前为什么迟迟不发?我个人猜测有两个原因:

  1. 算力优先级:V3 → V4 系列的迭代消耗了主力 GPU 集群,多模态推理对显存的额外开销让 PM 优先选了文本侧的提升
  2. 数据合规:图像里包含人脸、车牌、敏感场所等隐私元素,国内合规要求高,安全侧需要更长时间打磨

写在最后

这一周用 Claude Code + DeepSeek V4-Pro 替代原生 Claude 的体验只能用一个词形容——舒坦。账号不会被封、账单看得懂、能力跟得上、Skills 链路无缝。唯一让我难受的就是不收图这一件事,每次切回 Claude 都觉得是退回到了上一个时代。

这次识图模式灰度,不只是 DeepSeek 自己补一块拼图,对 Claude Code 用户来说,这是国产模型替换闭源 SOTA 的最后一道坎。两周后 API 开放、Anthropic 协议兼容层把 image 字段加上,Claude Code 接 DeepSeek 的工作流就真的没有缺角了。

如果你还在为 Claude 账号封禁的事焦虑、还在为多模态切来切去而烦躁——再忍两周。这条路走完,国产替换的故事,才算真正写完。

标签: none

添加新评论