deepseek-v4-flash 好像没大家说的这么智能啊?
感觉就比 minimaxm2.7 强点,感觉不如 qwen3.6plus ,glm5 和 kimi2.5 啊,我已经用了 2 亿多 token 了,实在没体验出智能
尤其是指令遵循,我在 hermes 中使用时常出现不遵守规则回复。
还有长记忆捞回测试,我上传了 900k 的武林外传的剧本 txt ,回答的很差欸
v4-pro 这个比较很可疑,但是 v4-flash 有时候我感觉和 minimax2.7 坐一桌的
尤其是指令遵循,我在 hermes 中使用时常出现不遵守规则回复。
还有长记忆捞回测试,我上传了 900k 的武林外传的剧本 txt ,回答的很差欸
v4-pro 这个比较很可疑,但是 v4-flash 有时候我感觉和 minimax2.7 坐一桌的