让 AI 帮你写大数据AI开发代码:MaxFrame Coding Skill 正式发布
"我想用 MaxFrame 处理一张千万级的用户行为表,按城市分组做聚合统计,但不太确定该用 "我想使用 MaxFrame 调用百炼大模型进行数据分析、打标,但不知道该使用哪些算子,如何构建完整开发流程......" "老板让我把一批 OSS 上的图片用大模型提取 Embedding,存回 MaxCompute 表里,可我不太熟悉 "我知道 MaxFrame 兼容 pandas API,但每次写完代码总是踩各种坑——忘记调 如果这些场景让你感到似曾相识,那么今天发布的 MaxFrame Coding Skill,就是为你准备的。 MaxFrame是阿里云MaxCompute 自研的、基于Python编程接口的分布式 AI 计算引擎,解决了传统单机数据处理中性能瓶颈和低效数据移动的两个难题。 MaxFrame可以直接在MaxCompute上实现PB级全模态数据的分布式处理、分析及离线推理,执行可视化数据探索分析、分布式机器学习/科学计算、大规模大模型离线推理等AI开发工作,支持 CPU、GPU 等异构计算资源混合调度,支持直接调用百炼进行大模型推理,从而满足用户在Python生态中日益增长的高效大数据处理和AI开发需求。 MaxFrame Coding Skill 是一款面向主流 AI 编程助手的智能插件。安装后,你的 AI Agent 将"学会"MaxFrame 开发的完整知识体系——从会话管理、算子选择、数据处理到结果写入,全链路覆盖。 简单来说:你只需要用自然语言描述需求,AI 就能帮你生成可直接运行的 MaxFrame 代码。 支持的 AI 编程工具包括:Claude Code、Cursor、Codex、OpenCode、Gemini CLI、通义灵码/Qoder 等。 MaxFrame 提供了丰富的算子体系——标准 pandas 算子、MaxFrame 专属的 Coding Skill 内置了一个 Operator Selector 智能代理,它能: Coding Skill 覆盖了 MaxFrame 开发的完整工作流: 而且它遵循一个 "确认再执行" 的工作模式: 这意味着生成的代码不是"大概能跑",而是"根据你的实际需求定制"。 Skill 内置了 10 个覆盖典型场景的完整示例,AI Agent 可以参考这些示例生成高质量代码: 你对 AI 说: AI 生成的代码: 无需部署模型、无需管理 GPU、无需编写推理服务。 ManagedTextLLM 内置多个模型(qwen2.5 系列、DeepSeek-R1 等),开箱即用。 你对 AI 说: AI 生成的代码核心部分: OSS 挂载为本地路径,分布式 Worker 自动并行读取,吞吐线性扩展。 你可能会问:我直接让 AI 写 MaxFrame 代码不行吗? 当然可以。但通用 AI 写出的 MaxFrame 代码,往往会踩这些坑: Coding Skill 不是一个简单的 Prompt,而是一套完整的知识注入体系——包含技能定义、算子选择代理、选择规则、上下文指南、API 文档和实战示例,总计覆盖数千页技术文档。 以 Claude Code 为例,三步完成安装: MaxFrame Coding Skill 安装完成后,直接对 AI 说: AI 将自动: MaxFrame Coding Skill 的目标不是取代开发者,而是 让开发者把精力放在业务逻辑上,把框架细节交给 AI。 无论你是 MaxFrame 新手还是老用户,Coding Skill 都能帮你: 现在就安装试试吧。欢迎在评论区分享你的使用体验! 相关链接:让 AI 帮你写大数据AI开发代码:MaxFrame Coding Skill 正式发布
你是否遇到过这些场景?
groupby(). agg() 还是 apply_chunk……"with_fs_mount 怎么挂载,with_running_options 怎么配 GPU……".execute()、Session 没销毁、UDF 返回类型不匹配……"一句话解释:它是什么?
它能做什么?
1. 智能算子选择:不再纠结该用什么 API
.mf 扩展算子(apply_chunk、map_reduce、flatmap、rebalance 等)、以及 UDF/UDTF 能力。面对一个数据处理需求,选择哪个算子最合适?groupby().mf.apply_chunk() 并解释为什么你:"我需要对时间序列数据做滚动平均"
AI:"推荐使用 DataFrame.rolling(),在 SQL Engine 和 DPE 上均支持。
如果需要自定义窗口逻辑,可以用 .mf.apply_chunk() 作为备选。"2. 全链路代码生成:从读数据到写结果
Session 创建 → 数据读取 → 算子选择确认 → 数据处理 → 结果写入 → Session 清理3. 十个开箱即用的代码模板
场景 示例 亮点 AI 函数调用 ai_function_basic.pyManagedTextLLM + 分布式推理 GPU 加速处理 gpu_unit_dpe_processing.py@with_running_options(gu=1)GPU 分配OSS 文件挂载 fs_mount_example.py@with_fs_mount分布式读取 OSS多 OSS 挂载 oss_multi_mount.py单/多 OSS 路径同时挂载 分组批处理 groupby_batch_processing.pygroupby + apply_chunk高效批处理复杂数据结构 complex_struct.py嵌套结构 + 自定义分组处理 Arrow 类型处理 complex_struct_arrow.pyPyArrow 复杂类型 + JSON 转换 DLF 外部表写入 dlf_table_write_basic.pyDLF 外部表配置和写入 实战演示:两个真实场景
场景一:用大模型做分布式问答
帮我写一个 MaxFrame 作业,用 qwen2.5 模型对一批问题做批量推理
from maxframe.learn.contrib.llm.models.managed import ManagedTextLLM
# 创建问答数据
df = md.DataFrame({
"query": ["地球距离太阳多远?", "水的沸点是多少?"]
})
df.execute()
# 一行代码调用大模型
llm = ManagedTextLLM(name="qwen2.5-1.5b-instruct")
messages = [
{"role": "system", "content": "You are a helpful assistant."},
{"role": "user", "content": "{query}"},
]
result = llm.generate(df, prompt_template=messages)
result.execute()场景二:挂载 OSS 做分布式文件处理
我要把 OSS 上的模型文件挂载到每个 Worker,测一下分布式读取的吞吐量
from maxframe.udf import with_fs_mount, with_running_options
@with_running_options(engine="dpe", cpu=2, memory=4)
@with_fs_mount(
"oss://your-bucket/model-files/",
"/mnt/model",
storage_options={"role_arn": "acs:ram::xxx:role/xxx"}
)
def read_model_directory(row):
import os
files = os.listdir("/mnt/model")
# 每个 Worker 独立读取、自动并行
...
为什么需要 Coding Skill?
常见问题 Coding Skill 的解法 使用不存在的 API 内置 900+ 页 API 文档,实时验证算子是否存在 忘记调用 .execute()强制遵循懒执行模式,代码模板自带执行触发 Session 忘记销毁 所有模板使用 try/finally模式确保清理UDF 返回类型不匹配 示例代码展示正确的 dtypes声明方式不知道该用哪个引擎 自动推荐 SQL Engine > DPE 的优先级 Series.apply性能差自动推荐 DataFrame.mf.apply_chunk替代方案技术架构
┌─────────────────────────────────────────────────┐
│ 你的 AI 编程助手 │
│ (Claude Code / Cursor / Codex / ...) │
├─────────────────────────────────────────────────┤
│ MaxFrame Coding Skill │
│ ┌──────────┐ ┌──────────┐ ┌──────────┐ │
│ │ 编码技能 │ │ 启动引导 │ │ 算子选择 │ │
│ │ SKILL │ │ Bootstrap│ │ Agent │ │
│ └──────────┘ └──────────┘ └──────────┘ │
│ ┌──────────┐ ┌──────────┐ ┌──────────┐ │
│ │ 上下文 │ │ 选择规则 │ │ API 文档 │ │
│ │ 指南 │ │ Rules │ │ 900+页 │ │
│ └──────────┘ └──────────┘ └──────────┘ │
│ ┌──────────────────────────────────────┐ │
│ │ 实战示例代码 │ │
│ └──────────────────────────────────────┘ │
├─────────────────────────────────────────────────┤
│ MaxFrame SDK │
│ DataFrame │ Tensor │ Learn │ UDF │ Session │
├─────────────────────────────────────────────────┤
│ MaxCompute 分布式AI引擎 │
│ MaxFrame │
└─────────────────────────────────────────────────┘
快速开始
# Step 1: 下载 Skill 安装包
# 下载 maxframe-coding-skill.zip
# Step 2: 解压到项目的 .claude/skills/ 目录
unzip maxframe-coding-skill.zip -d your-project/.claude/skills/
# Step 3: 验证目录结构
ls your-project/.claude/skills/maxframe-job-coding/
# 应包含: SKILL.md, examples/, references/, scripts/其他平台类似,只需将 zip 解压到对应平台的 skills 目录即可。例如 Cursor 解压到 .cursor/rules/,通义灵码解压到 .aone\_copilot/skills/。
创建一个 MaxFrame 作业,从 user_behavior 表读取数据,按 city 分组统计 GMV,结果写入 city_gmv_report 表写在最后