Claude Code + DeepSeek V4 多模态短板将补齐

JeecgBoot AI专题研究 | 用 DeepSeek V4 几乎完美替代 Claude，唯一卡点就是不收图——这块短板马上要补上

一句话先说结论

DeepSeek V4 系列上线一周多，密集跑下来，Claude Code 接 DeepSeek V4-Pro 已经能完美替代原生 Claude 跑日常开发：写代码、改 bug、跑 Skills、生成报表大屏、自动化部署，全部丝滑。唯一让人难受的短板就是 V4 还不收图——架构图、设计稿、错误截图扔不进去，只能切回 Claude。

好消息是：4 月 29 日 DeepSeek 已经在 Web 端灰度推送识图模式，这块短板很快就要被补齐。如果你和我一样在用 Claude Code + DeepSeek 的组合，再忍两周，体验就会齐活。

这一周用下来：DeepSeek V4 真的能替代 Claude

我之前写过一篇 Claude Code + DeepSeek V4-Pro 真实评测，结论是"除了贵，没别的毛病"。这几天密集再压一轮，结论要更乐观一些——贵的问题随着用量上来已经被摊平了，稳定性反而是最大的安慰。

具体替代效果分几条说：

① 代码生成与重构：基本无感切换

跑 JeecgBoot 的 Skills 生态——OA 流程自动搭建、积木 BI 大屏生成、钻取报表、自动化部署、Online 表单——这些场景下 DeepSeek V4-Pro 的输出质量和 Claude Sonnet 4.6 几乎打成平手。长上下文不掉链、工具调用准确率高、JSON 结构稳定，是工程化最看重的三个指标。

② 工具调用与 Skills 执行：兼容性满分

Anthropic 协议兼容层做得很到位，Claude Code 那一套 tools / tool_choice / tool_use 字段不需要改任何代码，直接换个 base URL 就能跑。Skills 执行链路里那些复杂的 nested tool call、多轮迭代修正、stream 模式，全部无缝。

③ 账号稳定性：真正的解放

这条本来排不到这么靠前，但最近半年 Claude 账号批量被封的消息一波接一波，身边的同事中招的不少。DeepSeek 是国内主体、计费透明、合规清晰，再不用每天担心一觉醒来号没了——光这一条就值回票价。

④ 成本：日常开销降到 1/5

Opus 4.6 输入价 $15/百万 tokens，DeepSeek V4-Pro 是 ¥4/百万 tokens 左右（折合不到 $0.6），输入端便宜 25 倍以上。一天写 200 万 token 的开发者，月度账单从四位数美金降到三位数人民币，企业用量更明显。

那个让人坐立不安的"唯一短板"：DeepSeek V4 不收图

舒服归舒服，但只要任务一旦涉及"看一眼这张图给点意见"，DeepSeek 就立刻举手投降。

模型收到截图后，在界面上诚实地打印出一行字：

没错------它看不见图片

V4-Pro 当前版本是纯文本模型，完全不支持图片输入。

Claude Code 在发送图片时，V4-Pro 会收到一个占位符 [Image #1]，但对实际图像内容毫无感知。所以你看到的那句"我无法直接查看图片"不是谦虚，是真的看不见。

对于日常编程工作流，这个限制影响面相当广：

截图报错让模型分析 → ❌ 看不见
发 UI 设计稿让模型写代码 → ❌ 看不见
发报表渲染结果让模型诊断问题 → ❌ 看不见
粘贴终端截图 → ❌ 看不见

社区里催识图能力的帖子从去年下半年到现在没断过，DeepSeek 团队也在 GitHub Issues 里多次回复"在做了在做了"。这次灰度上线，算是把欠了一年多的功课正式补上。

4 月 29 日的灰度推送：识图模式正式登场

灰度入口出现在 DeepSeek Web 端聊天框左下角的功能区，多了一个"识图"开关。开启后输入框右侧会出现回形针图标，可以直接拖拽或粘贴图片。API 端目前还没看到对应字段，但根据通常的灰度节奏，预计两周内会同步开放给 Pro 用户——这才是 Claude Code 用户真正等的那一天。

不是凭空出现：那些被忽略的多模态铺垫

很多人以为 DeepSeek 之前一直只做文本，识图能力是凭空冒出来。其实早就有伏笔，只是声量没那么大：

2024 年 12 月 · DeepSeek-VL2：开源 MoE 架构多模态模型，3 个尺寸（3B / 16B / 27B 激活），覆盖通用视觉任务
2025 年初 · Janus：统一视觉理解与生成的双流架构，解耦 encoder，生图与读图共享主干
2025 年 · JanusFlow：引入 Rectified Flow 训练范式，被 CVPR 2025 主会议收录
2025 年 · Janus-Pro：在 GenEval 基准上超越 DALL·E 3 与 Stable Diffusion，进入 SOTA 第一梯队

也就是说，DeepSeek 在多模态这条线上一直在砸论文和开源模型，缺的只是把它装进 Chat 主入口和 API 这一脚。这次灰度推送，本质上是把研究侧的能力正式产品化。

之前为什么迟迟不发？我个人猜测有两个原因：

算力优先级：V3 → V4 系列的迭代消耗了主力 GPU 集群，多模态推理对显存的额外开销让 PM 优先选了文本侧的提升
数据合规：图像里包含人脸、车牌、敏感场所等隐私元素，国内合规要求高，安全侧需要更长时间打磨

写在最后

这一周用 Claude Code + DeepSeek V4-Pro 替代原生 Claude 的体验只能用一个词形容——舒坦。账号不会被封、账单看得懂、能力跟得上、Skills 链路无缝。唯一让我难受的就是不收图这一件事，每次切回 Claude 都觉得是退回到了上一个时代。

这次识图模式灰度，不只是 DeepSeek 自己补一块拼图，对 Claude Code 用户来说，这是国产模型替换闭源 SOTA 的最后一道坎。两周后 API 开放、Anthropic 协议兼容层把 image 字段加上，Claude Code 接 DeepSeek 的工作流就真的没有缺角了。

如果你还在为 Claude 账号封禁的事焦虑、还在为多模态切来切去而烦躁——再忍两周。这条路走完，国产替换的故事，才算真正写完。