xiaohack's Blog

xiaohack博客专注前沿科技动态与实用技术干货分享，涵盖 AI 代理、大模型应用、编程工具、文档解析、SEO 实战、自动化部署等内容，提供开源项目教程、科技资讯日报、工具使用指南，助力开发者、AI 爱好者获取前沿技术与实战经验。

简单使用了一周在本地 Mac 的 qwen3.6-35b-a3b 模型

作者: 纯情
时间: 2026-04-27
分类:

感觉本地的模型有很大的潜力，但也有局限，主要是受限于硬件吧。以下几点：

除了复杂架构调整分析工作外，日常的 CRUD 开发、项目总结、文档翻译、需求输入和模块的 Bug 修复上，几乎可以替代在线模型。
复杂分析以及深度的问题查找、大上下文还受限于模型规模和内存。
经过豆包和模型自身给出 llm 优化建议，使用 GGUF 模型能跑出 33 token/s 的速度，使用 MLX 能到 38 token/s 。
36G 内存不够，开太大上下文会爆显存，只能重启。

第一次体会到 Mac 的性能居然这么不够用，搞得都想换 M5 Max 了，但感觉专门为 AI 也不是特别值得。

标签: none

添加新评论

上一篇: 做了个 Apple 国区 ICP 豁免申请的附件生成工具
下一篇: TCP/IP 学习资料