感觉就比 minimaxm2.7 强点,感觉不如 qwen3.6plus ,glm5 和 kimi2.5 啊,我已经用了 2 亿多 token 了,实在没体验出智能
尤其是指令遵循,我在 hermes 中使用时常出现不遵守规则回复。
还有长记忆捞回测试,我上传了 900k 的武林外传的剧本 txt ,回答的很差欸
v4-pro 这个比较很可疑,但是 v4-flash 有时候我感觉和 minimax2.7 坐一桌的

标签: none

添加新评论