但只有 9 token/s 好卡

直接 vLLM 和 SGlang 都不支持,使用了 [Model] Support IQuestCoder model by yxing-bj · Pull Request #31575 · vllm-project/vllm · GitHub 这个 PR,准备试试 Codeforces 和 SWE-bench


📌 转载信息
原作者:
Lattice
转载时间:
2026/1/2 12:35:57