NumPy

标签 NumPy 下的文章

【技术实操】加密资产量化交易 5 步实现：从数据到实盘的完整指南

作者: 纯情
时间: 2026-02-05
分类: 开源
评论

加密资产市场的高波动特性，给量化策略落地带来了不少实操挑战。作为技术开发者，如何把交易逻辑转化为可运行的自动化量化策略？本文从开发者视角，拆解加密资产量化交易的完整落地流程，聚焦数据、策略、回测、执行、优化五大核心环节，附可直接运行的代码示例。

一、核心问题：数据是量化策略的基础门槛
做量化交易时，开发者最常遇到的问题就是数据层面的坑：

数据源不稳定，行情数据延迟或丢失；
数据维度单一，缺乏核心交易指标；
数据格式不统一，增加后续处理成本。

而可靠的 API 工具能直接对接交易平台，获取指定交易对的实时价格、交易量等核心数据，为策略搭建扫清基础障碍。

二、实操步骤：5 步实现量化策略落地

步骤 1：获取实时行情数据
通过AllTick API 接口拉取目标加密资产的实时数据，是量化策略的第一步，核心代码如下（可直接复制运行）：

import requests
def get_crypto_data(symbol='BTCUSDT'): url = 'https://api.alltick.co/crypto/real-time' params = {'symbol': symbol} response = requests.get(url, params=params) data = response.json()
return data
# 获取比特币实时数据
btc_data = get_crypto_data('BTCUSDT')
print(btc_data)

开发者注意：
需提前安装requests库：pip install requests；
建议增加异常捕获（如try-except），处理接口请求超时、返回数据格式异常等问题。

步骤 2：构建移动平均策略逻辑
移动平均策略是量化交易的基础趋势策略，核心逻辑为「短期均线突破长期均线生成交易信号」，具体实现代码如下：

import pandas as pd import numpy as np
# 假设已经获取了历史数据 historical_data = pd.DataFrame(btc_data)
# 计算短期和长期移动平均
short_window = 50
long_window = 200 historical_data['short_mavg'] = 
historical_data['close'].rolling(window=short_window).mean()
historical_data['long_mavg'] = 
historical_data['close'].rolling(window=long_window).mean()
# 当短期均线突破长期均线时,产生买入信号
historical_data['signal'] = np.where(historical_data['short_mavg'] > 
historical_data['long_mavg'], 1, 0)

开发者注意：
需安装pandas和numpy：pip install pandas numpy；
若历史数据量不足 200 条，long_mavg会出现NaN，需补充数据或调整窗口参数。

步骤 3：搭建策略回测框架
策略写完后，必须通过回测验证有效性，避免直接投入实盘造成损失。以下是行业通用的极简回测框架代码：

def backtest_strategy(data): initial_balance = 10000
balance = initial_balance
position = 0 for i in range(1, len(data)): if data['signal'][i] == 1 and position == 0: position = balance / data['close'][i]
balance = 0
if position > 0: elif data['signal'][i] == 0 and position > 0: balance = position * data['close'].iloc[-1] balance = position * data['close'][i] position = 0
return balance - initial_balance
profit = backtest_strategy(historical_data)
print(f'回测利润: {profit}')

开发者注意：
该回测框架为基础版本，未考虑手续费、滑点等实际交易成本，生产环境需补充；
回测结果仅作参考，需结合样本外数据验证策略稳定性。

步骤 4：实现实时交易订单执行
回测达标后，通过 API 接口将策略信号转化为实际交易订单，减少人工操作误差，买入操作核心代码如下：

def place_order(symbol, side, quantity):
url = 'https://api.alltick.co/crypto/order' data = { 'symbol': symbol,
'side': side, # 'BUY' 或 'SELL'
'quantity': quantity,
'price': get_crypto_data(symbol)['price']
}
response = requests.post(url, json=data)
return response.json()
# 假设我们要买入0.1个比特币
order = place_order('BTCUSDT', 'BUY', 0.1)
print(order)

开发者注意：
实盘交易前需确认 API 接口权限、资金充足性；
建议先在模拟盘测试订单接口，避免因参数错误导致交易异常。

三、生产环境优化：策略迭代与风险控制
量化策略不是写完就结束，生产环境中需要持续优化：

参数迭代：定期基于最新历史数据重新回测，调整均线窗口、交易阈值等参数；
实时监控：编写监控脚本，跟踪策略运行状态，异常时触发止损或暂停机制；
风险控制：添加资金管控逻辑，限定单次交易资金占比（如不超过总资金的 10%）。

总结
加密资产量化交易的落地核心是「数据 - 策略 - 回测 - 执行 - 优化」的闭环，对开发者而言，重点在于：

保证数据获取的稳定性和准确性；
策略逻辑需兼顾简洁性和可验证性；
回测和实盘环节需考虑实际交易场景的边界条件。
以上代码均可直接运行，开发者可根据自身需求扩展功能（如添加日志、监控、参数优化模块）。

Matplotlib 入门指南：让数据"开口说话"的魔法库

作者: 纯情
时间: 2026-02-02
分类: 开源
评论

1. 库的概览与核心价值

想象一下，你手头有一份包含一百万条销售数据的 Excel 表格，密密麻麻的数字堆叠在一起，让你头晕眼花。你需要找出旺季和淡季的趋势，对比不同产品的销售表现，但这些冰冷的数据就像沉默的密码，让你难以快速洞察其中的规律。这就是数据可视化的痛点——没有图形，数据就是一堆难以理解的数字。

Matplotlib 正是为解决这个核心问题而生的强大工具。它就像一位精通绘画的数据翻译官，能将枯燥的数据转化为直观、生动的图表，让你一眼看出数据背后的故事。在 Python 数据科学生态中，NumPy 负责数值计算，Pandas 处理结构化数据，而 Matplotlib 则承担着将数据"可视化呈现"的关键使命，三者共同构成了数据分析的三剑客。

那么，为什么需要专门的 Matplotlib，而不是直接用 Excel 或其他工具呢？关键在于它的三个独特优势：

无缝集成：Matplotlib 与 NumPy、Pandas 完美兼容，你可以直接读取 DataFrame 或数组进行绘图，无需繁琐的数据导出导入
高度可定制：从坐标轴刻度、图例位置到颜色、字体、线型，每一个细节都可以精细控制，满足论文发表、专业汇报的苛刻要求
生态基石：作为 Python 可视化的开山鼻祖，它不仅是独立工具，更是 Seaborn、Plotly 等高级库的基础，学会了它，后续学习会更轻松

一句话总结：Matplotlib 让数据"说话"，让复杂的规律变得一目了然，是每位数据分析师必备的看家本领。

2. 环境搭建与"Hello, World"

安装说明

安装 Matplotlib 非常简单，推荐使用 pip 或 conda：

# 使用 pip 安装（推荐）
pip install matplotlib numpy

# 使用 conda 安装
conda install matplotlib numpy

注意：Matplotlib 通常与 NumPy 配合使用，建议同时安装。如果安装过程中遇到权限问题，可以尝试使用 --user 参数（pip）或创建虚拟环境。

最简示例

让我们用最经典的"正弦曲线"作为入门案例，只需 5 行代码就能画出一张漂亮的图表：

import matplotlib.pyplot as plt
import numpy as np

# 1. 准备数据：x从0到2π，取100个点
x = np.linspace(0, 2 * np.pi, 100)
y = np.sin(x)

# 2. 创建画布和绘图区域，并绘制曲线
fig, ax = plt.subplots(figsize=(8, 4))
ax.plot(x, y)

# 3. 添加标题和标签
ax.set_title("正弦函数图像")
ax.set_xlabel("x值（弧度）")
ax.set_ylabel("sin(x)")

# 4. 显示图表
plt.show()

逐行解释

第1-2行：导入 pyplot 子模块（简写为 plt）和 NumPy。pyplot 是 Matplotlib 的高级接口，提供了类似 MATLAB 的绘图函数，是日常绘图最常用的模块。
第4行：np.linspace(0, 2*np.pi, 100) 生成从 0 到 2π 的 100 个等间距点，这是 NumPy 的核心函数，非常适合生成连续变化的 x 轴数据。
第5行：np.sin(x) 计算 x 数组中每个元素的正弦值，返回对应的 y 数组。NumPy 的数学运算会自动应用到数组的每个元素，无需循环。
第8行：plt.subplots(figsize=(8, 4)) 同时创建 Figure（画布）和 Axes（坐标轴）对象。figsize 参数设置画布大小为 8 英寸宽、4 英寸高。推荐使用 subplots() 而非单独创建，因为它更高效且符合面向对象风格。
第9行：ax.plot(x, y) 在 Axes 对象上绘制折线图。这是最核心的绘图函数，将 x 和 y 数组连接成一条平滑的曲线。
第12-14行：set_title()、set_xlabel()、set_ylabel() 分别设置图表标题、x 轴标签和 y 轴标签。所有以 set_ 开头的方法都是在配置 Axes 的属性。
第17行：plt.show() 弹出窗口显示图表。在 Jupyter Notebook 中，可以省略这行代码直接在单元格中显示。

预期输出：运行后会弹出一个窗口，展示一条波浪状的正弦曲线，x 轴范围是 0 到 2π，y 轴范围是 -1 到 1，曲线从原点出发，先上升到 1（π/2 处），下降到 -1（3π/2 处），最后回到 0（2π 处）。

解决中文显示问题

Matplotlib 默认不支持中文，会导致中文显示为方块。需要在导入后添加以下配置：

import matplotlib.pyplot as plt
import matplotlib

# 设置中文字体（Windows 用 SimHei，Mac 用 Arial Unicode MS）
plt.rcParams['font.sans-serif'] = ['SimHei']
# 解决负号显示为方块的问题
plt.rcParams['axes.unicode_minus'] = False

3. 核心概念解析

理解 Matplotlib 的核心概念是掌握它的关键。新手容易混淆的主要是以下四个对象，它们之间的关系就像画画工具的层级：

3.1 Figure（画布）

Figure 是整个图表的容器，相当于一张白纸或画框。一个 Figure 可以包含多个 Axes（子图），它负责管理整个图像的尺寸、背景色、边框等全局属性。你可以把 Figure 想象成一个画板，所有的图表元素都画在这个画板上。

fig = plt.figure(figsize=(10, 6), facecolor='lightgray')

3.2 Axes（坐标轴/子图）

Axes 是实际绘图的区域，每个 Axes 都包含独立的坐标系（x 轴、y 轴）、标题、标签、图例等元素。一个 Figure 可以有多个 Axes（比如 2×2 的子图布局），但每个 Axes 只能属于一个 Figure。你可以把 Axes 想象成画板上的一个画框，具体的线条、点、文字都画在这个画框里。

fig, ax = plt.subplots()  # 创建包含一个 Axes 的 Figure
fig, axs = plt.subplots(2, 2)  # 创建包含 2×2 个 Axes 的 Figure

3.3 Axis（坐标轴对象）

每个 Axes 包含两个（或 3D 图中的三个）Axis 对象，分别代表 x 轴和 y 轴。Axis 负责控制刻度（ticks）、刻度标签（tick labels）、坐标轴范围（limits）等。比如 x 轴的刻度位置是 0、π/2、π、3π/2、2π，刻度标签就是对应的数字。

ax.set_xlim(0, 10)  # 设置 x 轴范围
ax.set_xticks([0, 5, 10])  # 设置 x 轴刻度位置
ax.set_xticklabels(['起点', '中点', '终点'])  # 设置刻度标签

3.4 Artist（艺术家对象）

Artist 是所有可见元素的统称，包括线条（Line2D）、文本（Text）、矩形（Rectangle）、图例（Legend）等。Figure、Axes、Axis 本身也是 Artist。当调用 plt.show() 或 plt.savefig() 时，所有 Artist 会被渲染到画布上。

line, = ax.plot([1, 2, 3], [4, 5, 6])  # line 是一个 Line2D Artist
title = ax.set_title("标题")  # title 是一个 Text Artist

核心概念关系图

以下 Mermaid 图表展示了这些核心对象之间的层次关系：

graph TD
    A[Figure<br/>画布容器] --> B[Axes<br/>绘图区域1]
    A --> C[Axes<br/>绘图区域2]
    A --> D[Axes<br/>绘图区域N]
    B --> E[Axis X<br/>X轴对象]
    B --> F[Axis Y<br/>Y轴对象]
    B --> G[Line2D<br/>线条]
    B --> H[Text<br/>标题/标签]
    B --> I[Legend<br/>图例]
    E --> J[刻度]
    E --> K[刻度标签]
    F --> L[刻度]
    F --> M[刻度标签]

这个图清晰地展示了：

Figure 是最顶层容器，可以包含多个 Axes
每个 Axes 包含 Axis 对象和具体的 Artist 元素
Axis 负责刻度和标签管理
所有的 Artist 最终渲染到 Figure 上

记住一句话：我们绘图时，先创建 Figure，再在 Figure 上添加 Axes，最后在 Axes 上调用绘图方法（如 plot()、scatter()、bar()），然后通过 set_xxx() 方法配置样式，最后用 plt.show() 或 plt.savefig() 展示或保存图表。

4. 实战演练：分析电影评分趋势

需求分析

假设我们有一份电影数据集，包含电影类型、评分、上映年份等信息。我们需要分析不同类型电影的平均评分趋势，找出评分最高和最低的电影类型，并用可视化方式展示结果。这个任务涉及数据统计、多系列折线图绘制、图例和标签设置等核心技能。

方案设计

我们将按以下步骤实现：

生成模拟数据（包含电影类型、评分、年份）
按类型和年份分组计算平均评分
使用 Matplotlib 绘制多系列折线图，每种类型一条曲线
添加图例、标题、标签，美化图表样式
保存为高清图片

这个案例将练习以下核心功能：DataFrame 分组统计、subplots 多图布局、plot 折线图、图例和标签设置、样式定制、图片保存。

完整代码实现

import matplotlib.pyplot as plt
import numpy as np
import pandas as pd

# ===== 步骤1：生成模拟数据 =====
np.random.seed(42)  # 确保结果可复现

# 电影类型列表
genres = ['剧情', '动作', '喜剧', '科幻', '恐怖', '爱情']
n_movies = 1000  # 总电影数

# 生成随机数据
data = {
    'genre': np.random.choice(genres, n_movies),
    'year': np.random.randint(2010, 2024, n_movies),
    'rating': np.random.uniform(3.0, 9.0, n_movies)  # 评分3.0-9.0
}
df = pd.DataFrame(data)

# ===== 步骤2：数据统计 =====
# 按类型和年份分组，计算平均评分
grouped = df.groupby(['genre', 'year'])['rating'].mean().reset_index()

# 将数据转换为更适合绘图的格式：每种类型一个 Series
pivot_data = grouped.pivot(index='year', columns='genre', values='rating')

# ===== 步骤3：创建图表 =====
fig, ax = plt.subplots(figsize=(12, 6))

# 为每种类型绘制一条曲线，使用不同颜色和标记
colors = plt.cm.tab10(np.linspace(0, 1, len(genres)))
markers = ['o', 's', '^', 'D', 'v', 'p']

for i, genre in enumerate(genres):
    if genre in pivot_data.columns:
        ax.plot(pivot_data.index, pivot_data[genre],
                color=colors[i],
                marker=markers[i],
                markersize=6,
                linewidth=2,
                label=genre)

# ===== 步骤4：美化图表 =====
ax.set_title('2010-2023年各类型电影平均评分趋势',
             fontsize=16, pad=20)
ax.set_xlabel('年份', fontsize=12)
ax.set_ylabel('平均评分', fontsize=12)

# 设置 x 轴刻度为每年一个
ax.set_xticks(range(2010, 2024))
ax.set_xticklabels([str(year) for year in range(2010, 2024)],
                   rotation=45, ha='right')

# 设置 y 轴范围，突出差异
ax.set_ylim(3.0, 9.0)
ax.grid(True, linestyle='--', alpha=0.3)

# 添加图例
ax.legend(loc='upper left', fontsize=10, ncol=3)

# 添加参考线（平均分）
avg_rating = df['rating'].mean()
ax.axhline(y=avg_rating, color='red', linestyle=':',
           linewidth=1.5, label=f'总体平均分 ({avg_rating:.2f})')

# ===== 步骤5：保存和显示 =====
plt.tight_layout()  # 自动调整布局，避免标签被截断
plt.savefig('movie_rating_trend.png', dpi=300, bbox_inches='tight')
print("图表已保存为 movie_rating_trend.png")
plt.show()

运行说明

将上述代码保存为 movie_analysis.py 文件
确保已安装依赖：pip install matplotlib numpy pandas
运行命令：python movie_analysis.py
程序会弹出窗口显示图表，并在当前目录下生成 movie_rating_trend.png 高清图片

结果展示

生成的图表将展示：

6条折线：每种电影类型一条曲线，用不同颜色和标记区分
x 轴：2010-2023 年，每年一个刻度，标签旋转 45 度避免重叠
y 轴：评分范围 3.0-9.0，突出评分差异
红色虚线：总体平均分参考线，便于对比
图例：显示所有类型和参考线，位于左上角，分 3 列排列
网格线：浅灰色虚线，辅助读取数据

这个案例展示了 Matplotlib 的核心能力：数据处理与可视化的无缝结合、多系列图表绘制、样式精细控制、专业级图表输出。掌握了这些技能，你就能应对大多数数据可视化任务。

5. 最佳实践与常见陷阱

常见错误及规避方法

错误1：混淆 `Figure` 和 `Axes`

问题描述：直接使用 plt.plot() 绘图，却不知道"画在哪个 Axes 上"，导致多图布局混乱。

# ❌ 错误做法：使用 pyplot 状态机，难以控制
plt.plot(x, y1)  # 自动创建 fig1 和 ax1
plt.figure()     # 新建 fig2
plt.plot(x, y2)  # 画在 fig2 的 ax2 上，但 ax1 无法再修改

# ✅ 正确做法：手动创建 Axes，精准控制
fig, (ax1, ax2) = plt.subplots(1, 2, figsize=(10, 4))
ax1.plot(x, y1)
ax1.set_title('图表1')
ax2.plot(x, y2)
ax2.set_title('图表2')

原因：plt 是便捷接口，会自动创建和管理对象，但复杂绘图时容易失控。面向对象风格更清晰、更可控。

错误2：保存图表的顺序错误

问题描述：先 plt.show() 再 plt.savefig()，保存的是空白图片！

# ❌ 错误做法
plt.show()           # 弹出窗口并释放资源
plt.savefig('plot.png')  # 此时 Figure 已为空，保存空白

# ✅ 正确做法
plt.savefig('plot.png', dpi=300, bbox_inches='tight')  # 先保存
plt.show()            # 再显示

原因：plt.show() 会弹出窗口并释放绘图资源，之后再调用 savefig() 时 Figure 已为空。必须先保存再显示。

错误3：中文显示乱码

问题描述：图表中的中文显示为方块，无法识别。

# ❌ 错误做法：未配置字体
plt.title('电影评分趋势')  # 显示为方块

# ✅ 正确做法：配置中文字体
import matplotlib.pyplot as plt

plt.rcParams['font.sans-serif'] = ['SimHei']  # Windows 用黑体
# plt.rcParams['font.sans-serif'] = ['Arial Unicode MS']  # Mac 用这个
plt.rcParams['axes.unicode_minus'] = False  # 解决负号显示为方块
plt.title('电影评分趋势')  # 正确显示中文

原因：Matplotlib 默认字体不支持中文，axes.unicode_minus 也需设置为 False 否则负号会乱码。

错误4：误解 `figsize` 的单位

问题描述：以为 figsize=(8, 4) 表示 8 像素×4 像素，结果图片太小。

# ❌ 错误理解
fig = plt.figure(figsize=(8, 4))  # 不是 8×4 像素！

# ✅ 正确理解
fig = plt.figure(figsize=(8, 4), dpi=100)  # 8英寸×4英寸，dpi=100，实际是 800×400 像素
# 想要 800×400 像素，要么设置 dpi=100，要么设置 figsize=(8, 4) 且 dpi=100

原因：figsize 的单位是"英寸"，而非像素。最终像素数 = figsize × dpi（默认 dpi=100）。

最佳实践建议

优先使用面向对象接口：虽然 plt.plot() 更简洁，但复杂场景（如多子图、自定义样式）必须用 fig, ax = plt.subplots() 面向对象风格。
统一配置字体和样式：在脚本开头一次性设置 rcParams，避免每个图表都重复配置。
养成使用 tight_layout() 的习惯：自动调整子图间距，避免标签被截断。
合理设置 dpi 参数：保存图片时 dpi=300 适合打印，dpi=150 适合屏幕显示，dpi=72 适合网页。
利用 colormaps 自动生成配色：不要手动指定颜色列表（如 ['red', 'blue', 'green']），用 plt.cm.tab10 或 plt.cm.viridis 生成专业配色。
保存图片时使用 bbox_inches='tight'：自动裁剪空白边距，让图片更紧凑。
多图布局时用 subplots_adjust 微调：当 tight_layout() 不能满足需求时，手动调整 left, right, top, bottom, wspace, hspace 参数。
避免使用过时的 API：如 plt.axes() 已被 plt.subplots() 替代，plt.hold() 已在新版本中移除。

6. 进阶指引

掌握了基础用法后，你可以继续探索 Matplotlib 的高级功能和生态系统：

高级功能

多子图复杂布局：使用 plt.subplot_mosaic() 创建非网格状布局（如左大右小、上一下三等）
3D 可视化：使用 mpl_toolkits.mplot3d 绘制三维曲面图、散点图
动画制作：使用 matplotlib.animation 模块制作动态图表，展示数据变化过程
交互式可视化：结合 ipywidgets 在 Jupyter Notebook 中实现滑块、下拉框等交互控件

生态扩展

Seaborn：基于 Matplotlib 的高级库，提供更简洁的 API 和更美观的默认样式，适合快速生成统计图表
Plotly：专注于交互式可视化，生成的图表支持缩放、拖拽、悬停查看数据，适合网页展示
Cartopy：地理数据可视化，支持地图投影、地理坐标转换等

学习资源

官方文档：https://matplotlib.org/stable/（最权威的信息源）
示例画廊：https://matplotlib.org/stable/gallery/（大量示例代码，可直接复制修改）
用户指南：https://matplotlib.org/stable/tutorials/index.html（系统学习教程）
FAQ：https://matplotlib.org/stable/faq/（常见问题解答）
Stack Overflow：搜索 matplotlib 标签，海量实战问题解答

学习路径建议

第一阶段（1-2周）：熟练掌握折线图、柱状图、散点图、饼图、直方图 5 种基础图表
第二阶段（2-3周）：学会多子图布局、样式定制、图例标签设置
第三阶段（3-4周）：尝试 3D 可视化、动画制作、交互式图表
第四阶段（持续）：结合实际项目（如个人数据分析、Kaggle 比赛），在实战中积累经验

记住：Matplotlib 的核心是"多动手实践"。找一份真实数据（如公开数据集、个人消费记录），尝试用不同图表展示，逐步掌握参数调整和样式优化。从基础图表到专业可视化，Matplotlib 能伴随你从数据分析新手成长为可视化高手。

[源码解析]网格交易总亏钱?试着用Python复现Avellaneda-Stoikov做市模型

作者: 纯情
时间: 2026-01-29
分类: 开源
评论

引言:从“几何图形”到“概率博弈”
在量化交易(Quantitative Trading)的入门阶段，网格策略(Grid Trading)几乎是每个开发者的必修课。写一个while True循环，基于固定的Price Gap挂出Buy/Sell Limit单。

但实盘教训往往很惨痛：静态网格在单边行情下极其脆弱。因为缺乏对库存(Inventory)的感知，程序会在下跌趋势中机械地“接飞刀”，直至耗尽流动性被套牢。

最近重读高频交易(HFT)经典文献Avellaneda-Stoikov(AS)模型，发现它的核心思想完全可以降维打击普通网格——将“死扛”转化为“库存博弈”。

本文将分享如何用Python复现AS模型的核心逻辑，并探讨在Python这种非实时系统下，如何通过高性能行情API来弥补速度短板。

理论核心:重新定义“中间价”
传统的网格策略是“几何对称”的：Ask = Mid + Gap Bid = Mid - Gap

AS模型提出了一个颠覆性的概念：保留价格(Reservation Price, r)。它认为，交易员不应锚定市场价，而应锚定自己的“心理价”。

其核心计算公式如下(建议直接复制)：

r = s - q × γ × σ²

作为开发者，我们需要深入理解这四个变量的物理含义，以及工程实现上的妥协：

s (Mid Price):市场共识
当前订单薄的买一卖一均价。[进阶注解]：在高频领域，通常会使用微观价格(Micro-price)或考虑订单流不平衡(OFI)来修正s。但作为入门复现，直接使用Mid Price是性价比最高的选择。
q (Inventory Factor): 库存压力——策略的灵魂
这是AS模型的重力参数。[工程避坑]：绝对不能直接用持仓数量(如10000)代入公式。必须归一化： q = (当前持仓 - 目标持仓) / 满仓限制

q > 0(积压)：r < s。挂单整体下移，降价甩卖，拒接新货。

q < 0(短缺)：r > s。挂单整体上移，溢价抢筹，惜售不卖。

γ (Risk Aversion): 风险厌恶系数
策略的性格参数。γ越大，策略越“怂”，稍微拿点货就拼命降价。
σ² (Volatility): 市场波动率
[工程妥协]：学术界通常使用GARCH模型或已实现波动率(Realized Volatility)。但在工程落地时，使用ATR或滚动窗口的标准差(Std)通常已经足够捕捉盘面风险。

源码实现:封装AS_Grid_Logic类
Talk is cheap, show me the code.以下是基于Python的算法逻辑封装。为了降低理解门槛，我们对AS模型进行了工程化简化：保留了最核心的库存偏斜(Skew)，而将复杂的价差宽度(Spread)计算简化为ATR动态调整。

import numpy as np

class AS_Grid_Logic:
    """
    Avellaneda-Stoikov动态网格策略核心逻辑
    """
    def __init__(self, risk_gamma: float = 0.5, max_pos: int = 1000):
        """
        :param risk_gamma: 风险厌恶系数(Gamma), 值越大策略越倾向于去库存
        :param max_pos: 最大持仓限制, 用于归一化计算
        """
        self.risk_gamma = risk_gamma
        self.max_pos = max_pos

    def calculate_skew(self, current_pos: int, volatility: float) -> float:
        """
        计算价格偏移量(Spread Shift)
        """
        # 防御性编程: 避免除零错误
        if self.max_pos == 0:
            return 0.0
        
        # 1.关键步骤:归一化库存q (-1.0 ~ 1.0)
        # 如果不归一化，公式中的线性惩罚项会直接溢出
        q = current_pos / self.max_pos
        
        # 2.核心公式: Shift = q * gamma * sigma^2
        # 物理含义: 库存压力 * 怂的程度 * 市场风浪
        shift = q * self.risk_gamma * (volatility ** 2)
        return shift

    def get_quotes(self, mid_price: float, current_pos: int, 
                   volatility: float, half_spread: float):
        """
        生成最终的Bid/Ask价格
        :param mid_price: 当前市场中间价
        :param current_pos: 当前持仓
        :param volatility: 波动率(如ATR或std)
        :param half_spread: 基础网格半宽(此处简化处理，未使用AS模型的k参数求解)
        :return: (bid_price, ask_price, reservation_price)
        """
        # 计算偏移
        shift = self.calculate_skew(current_pos, volatility)
        
        # 计算保留价格(Reservation Price)
        # 这一步将锚点从市场价s切换到了心理价r
        reservation_price = mid_price - shift
        
        # 生成围绕保留价格的网格
        bid_price = reservation_price - half_spread
        ask_price = reservation_price + half_spread
        
        return bid_price, ask_price, reservation_price

# --- 单元测试/模拟运行 ---
if __name__ == "__main__":
    # 初始化策略: 比较激进的去库存设定(Gamma=1.5)
    logic = AS_Grid_Logic(risk_gamma=1.5, max_pos=1000)
    
    # 模拟场景: 市场价100，满仓被套(pos=1000)，高波动(vol=2.0)
    bid, ask, res_p = logic.get_quotes(
        mid_price=100.0, 
        current_pos=1000, 
        volatility=2.0, 
        half_spread=0.5
    )
    
    print(f"Market Mid Price: 100.00")
    print(f"Inventory Ratio (q): 1.0 (满仓焦虑状态)")
    print(f"Reservation Price: {res_p:.2f} (心理中枢大幅下移)")
    print(f"Algo Bid: {bid:.2f} (防止接盘)")
    print(f"Algo Ask: {ask:.2f} (降价甩卖)")

运行结果解析：在满仓且高波动场景下，算法将Ask报价从理论的100.5压低到了94.5(示例值)。这在代码层面实现了：“只要我有货且市场不稳，我就比谁跑得都快”。

工程挑战:Python跑做市是伪命题吗？
这也是很多资深交易员会质疑的点：“Python有GIL锁，延迟那么高，跑AS模型不是找死吗？”

你是对的，但也不全对。你跑不赢FPGA驱动的顶级HFT团队，但你的对手盘如果是散户，你只需要跑赢HTTP轮询即可。

在实盘落地时，我们需要解决两个工程瓶颈：

1.Maker策略的费率控制 AS模型本质是提供流动性(Market Making)。

痛点：高频调整挂单容易导致在价格剧烈波动时误成交为Taker。

优化：不要每秒都重挂单。在代码中增加min_step_filter(最小变动过滤器)，只有当abs(new_price - old_price) > threshold时才发送Order Update请求。

2.逆向选择(Adverse Selection)与数据源延迟这是最致命的。当Python算出r需要下移时，通常是因为市场已经发生了Micro-crash。

瓶颈：如果你使用的是普通的RESTful行情API(轮询机制)，延迟通常在500ms~1000ms。等你的Cancel Order到达交易所，原本的Buy Limit早就被Toxic Flow击穿了。

解决方案：必须升级行情API的接入方式。

技术选型建议：TickDB 对于Python开发者，如果不想花大量时间维护C++的底层连接，推荐使用TickDB这样的专业数据基础设施：

WebSocket Stream：实盘必须使用WebSocket订阅全量Tick数据。TickDB提供的行情API可以实现毫秒级的Tick推送。

Event-Driven(事件驱动)：将策略架构改为OnTick()事件驱动模式。TickDB的Python SDK能够很好地适配这种模式，确保策略在接收到最新Tick的瞬间完成计算和发单。

Data Consistency：AS模型依赖准确的volatility计算。TickDB提供的清洗后的历史Tick数据，可以方便地预热计算ATR。

总结
从“死网格”进化到“AS动态网格”，本质是量化思维的升维：

算法层：引入Inventory(q)和Volatility(σ)因子，使策略具备自我保护能力。

工程层：承认Python的速度局限，通过接入高性能行情API(TickDB)，利用WebSocket低延迟特性构建护城河。

代码已开源在文中，欢迎各位开发者Copy测试。如有关于行情API对接或算法优化的疑问，欢迎在评论区技术交流。

NumPy技术文档：科学计算的基石

作者: 纯情
时间: 2026-01-27
分类: 开源
评论

1. 库的概览与核心价值

想象一下，在数据科学的战场上，如果缺少高效的数值计算能力，就像厨师缺少了锋利的刀具——你依然可以切菜，但效率低下且难以处理复杂的食材。NumPy 正是为解决科学计算中的效率瓶颈而生的工具。

NumPy（Numerical Python）是 Python 科学计算生态系统的核心基石，它提供了高性能的多维数组对象和用于处理这些数组的工具。在 Python 生态中，NumPy 的地位类似于建筑物的地基——虽然平时不常被直接看到，但几乎所有上层的数据科学库（如 Pandas、Scikit-learn、TensorFlow）都构建在 NumPy 之上。

NumPy 解决的核心问题是在 Python 中进行大规模数值计算时的性能瓶颈。通过提供连续内存存储的数组和向量化操作，NumPy 将计算速度提升了几个数量级，让 Python 在科学计算领域具备了与 C、Fortran 等编译型语言竞争的能力。无论是处理百万级的数据集，还是进行复杂的矩阵运算，NumPy 都是不可或缺的工具。

2. 环境搭建与"Hello, World"

安装说明

NumPy 的安装非常简单，推荐使用以下方式：

使用 pip 安装：

pip install numpy

使用 conda 安装（推荐用于 Anaconda 用户）：

conda install numpy

验证安装：

python -c "import numpy; print(numpy.__version__)"

常见安装问题：如果安装过程中出现权限错误，请使用 --user 参数；如果网络不稳定，考虑使用国内镜像源。

Hello, World 示例

让我们从一个最简单的示例开始，体验 NumPy 的核心功能：

import numpy as np

# 创建一个包含5个元素的一维数组
arr = np.array([1, 2, 3, 4, 5])

# 对数组中的每个元素进行平方运算
squared = arr ** 2

print(f"原始数组: {arr}")
print(f"平方结果: {squared}")
print(f"平均值: {np.mean(arr)}")

逐行解释：

import numpy as np：导入 NumPy 库并使用 np 作为别名，这是社区的通用约定
arr = np.array([1, 2, 3, 4, 5])：创建一个 NumPy 数组对象，这是 NumPy 最核心的数据结构
squared = arr ** 2：使用向量化操作对数组中所有元素进行平方，无需循环
np.mean(arr)：计算数组的平均值，这是 NumPy 提供的众多统计函数之一

预期输出：

原始数组: [1 2 3 4 5]
平方结果: [ 1  4  9 16 25]
平均值: 3.0

这个简单的示例展示了 NumPy 的三个关键特性：数组创建、向量化运算和内置数学函数。

3. 核心概念解析

NumPy 的强大建立在几个核心概念之上，理解这些概念是掌握 NumPy 的关键。

3.1 ndarray：多维数组对象

ndarray（n-dimensional array）是 NumPy 的核心数据结构，它是一个同质的多维容器，其中所有元素必须是相同类型。与 Python 原生列表相比，ndarray 在内存中是连续存储的，这使得访问速度更快，也支持向量化操作。

关键特性：

维度（ndim）：数组的维度数量，如一维、二维、三维等
形状（shape）：每个维度上的元素数量，如 (3, 4) 表示3行4列
数据类型（dtype）：数组中元素的类型，如 int32、float64 等

3.2 广播机制

广播是 NumPy 的魔法机制，它允许不同形状的数组进行算术运算。当操作两个数组时，NumPy 会自动将较小的数组"广播"到较大数组的形状上，而无需显式复制数据。

广播规则：

如果两个数组的维度数不同，则在较小数组的形状前面补1
如果两个数组的形状在某个维度上不匹配，但其中一个为1，则扩展为匹配
如果所有维度都匹配或其中一个为1，则广播成功，否则报错

3.3 向量化运算

向量化是指用数组表达式代替显式循环来处理数据。NumPy 的向量化运算底层使用 C 语言实现，比 Python 循环快几十倍甚至上百倍。

概念关系图：

graph TD
    A[ndarray 多维数组] --> B[连续内存存储]
    A --> C[统一数据类型]
    A --> D[维度与形状属性]
    
    B --> E[高效内存访问]
    C --> F[类型优化计算]
    D --> G[灵活数据组织]
    
    E --> H[向量化运算]
    F --> H
    G --> H
    
    H --> I[广播机制]
    H --> J[性能优化]
    
    I --> K[灵活数组运算]
    J --> L[大规模数据处理能力]
    
    K --> M[科学计算应用]
    L --> M

这三个概念相互配合，构成了 NumPy 高效计算的基础：ndarray 提供了数据容器，向量化运算提供了高效操作，而广播机制则增强了运算的灵活性。

4. 实战演练：解决一个典型问题

让我们通过一个实际项目来体验 NumPy 的强大功能。我们将构建一个简单的数据分析工具，分析某公司过去12个月的销售额数据，计算统计指标并识别销售趋势。

需求分析

我们需要：

处理12个月的销售额数据（单位：万元）
计算基本统计信息：平均值、标准差、最大最小值
计算移动平均值以平滑数据
识别异常销售月份（超过平均值2个标准差）
计算环比增长率

方案设计

选择 NumPy 的原因：

数组创建：快速构造销售数据数组
统计函数：内置 mean、std、max、min 等函数
数组切片：高效提取数据子集
布尔索引：快速筛选异常数据
向量化运算：高效计算增长率

代码实现

import numpy as np

# 步骤1：创建销售数据（模拟12个月的销售数据）
monthly_sales = np.array([120, 135, 128, 142, 156, 148, 163, 175, 169, 182, 195, 188])

# 步骤2：计算基本统计信息
mean_sales = np.mean(monthly_sales)
std_sales = np.std(monthly_sales)
max_sales = np.max(monthly_sales)
min_sales = np.min(monthly_sales)

print("=== 基本统计信息 ===")
print(f"平均销售额: {mean_sales:.2f} 万元")
print(f"标准差: {std_sales:.2f} 万元")
print(f"最高销售额: {max_sales} 万元")
print(f"最低销售额: {min_sales} 万元")

# 步骤3：计算3个月移动平均值
window_size = 3
moving_avg = np.convolve(monthly_sales, np.ones(window_size)/window_size, mode='valid')

print(f"\n=== {window_size}个月移动平均值 ===")
for i, avg in enumerate(moving_avg):
    print(f"{i+1}-{i+window_size}月: {avg:.2f} 万元")

# 步骤4：识别异常月份（超过平均值2个标准差）
threshold = mean_sales + 2 * std_sales
abnormal_months = np.where(monthly_sales > threshold)[0]

print(f"\n=== 异常销售月份（超过{threshold:.2f}万元）===")
if len(abnormal_months) > 0:
    for month_idx in abnormal_months:
        print(f"{month_idx + 1}月: {monthly_sales[month_idx]}万元")
else:
    print("无异常月份")

# 步骤5：计算环比增长率
growth_rates = np.diff(monthly_sales) / monthly_sales[:-1] * 100

print(f"\n=== 环比增长率 ===")
for i, rate in enumerate(growth_rates):
    print(f"{i+2}月相对于{i+1}月: {rate:+.2f}%")

# 步骤6：整体趋势分析
overall_trend = np.polyfit(range(len(monthly_sales)), monthly_sales, 1)[0]
print(f"\n=== 整体趋势 ===")
print(f"月均增长: {overall_trend:.2f} 万元")
if overall_trend > 0:
    print("趋势: 上升")
else:
    print("趋势: 下降")

运行说明

将上述代码保存为 sales_analysis.py，然后在命令行运行：

python sales_analysis.py

结果展示

程序将输出完整的销售数据分析报告：

=== 基本统计信息 ===
平均销售额: 158.33 万元
标准差: 24.17 万元
最高销售额: 195 万元
最低销售额: 120 万元

=== 3个月移动平均值 ===
1-3月: 127.67 万元
2-4月: 135.00 万元
3-5月: 142.00 万元
4-6月: 148.67 万元
5-7月: 155.67 万元
6-8月: 162.00 万元
7-9月: 169.00 万元
8-10月: 175.33 万元
9-11月: 182.00 万元
10-12月: 188.33 万元

=== 异常销售月份（超过206.67万元）===
无异常月份

=== 环比增长率 ===
2月相对于1月: +12.50%
3月相对于2月: -5.19%
4月相对于3月: +10.94%
5月相对于4月: +9.86%
6月相对于5月: -5.13%
7月相对于6月: +10.14%
8月相对于7月: +7.36%
9月相对于8月: -3.43%
10月相对于9月: +7.69%
11月相对于10月: +7.14%
12月相对于11月: -3.59%

=== 整体趋势 ===
月均增长: 5.86 万元
趋势: 上升

这个实战项目展示了 NumPy 在数据分析中的典型应用：数据创建、统计计算、滑动窗口、条件筛选、趋势分析等。所有操作都通过向量化运算完成，代码简洁且高效。

5. 最佳实践与常见陷阱

常见错误与规避方法

错误1：数据类型不一致导致的精度丢失

# ❌ 错误做法
arr = np.array([1.5, 2.7, 3.9], dtype=int)  # 强制转换为整数，丢失小数部分
print(arr)  # 输出: [1 2 3]

# ✅ 正确做法
arr = np.array([1.5, 2.7, 3.9])  # 保持默认的float64类型
print(arr)  # 输出: [1.5 2.7 3.9]

错误2：数组视图与拷贝混淆

# ❌ 错误做法：误以为切片创建了新数组
original = np.array([1, 2, 3, 4, 5])
slice_view = original[1:4]
slice_view[0] = 99
print(original)  # 输出: [ 1 99  3  4  5] - 原数组被修改！

# ✅ 正确做法：显式创建拷贝
original = np.array([1, 2, 3, 4, 5])
slice_copy = original[1:4].copy()
slice_copy[0] = 99
print(original)  # 输出: [1 2 3 4 5] - 原数组保持不变

错误3：不合理的循环使用

# ❌ 错误做法：使用 Python 循环处理数组
arr = np.random.rand(1000000)
result = np.zeros_like(arr)
for i in range(len(arr)):
    result[i] = arr[i] * 2 + 1

# ✅ 正确做法：使用向量化运算
result = arr * 2 + 1

最佳实践建议

1. 内存优化：
对于大型数组，使用合适的数据类型可以显著减少内存占用：

# 对于0-255的整数，使用uint8而非默认的int64
small_integers = np.array([1, 2, 3, 255], dtype=np.uint8)

2. 预分配数组：
在循环中预分配数组比动态扩展更高效：

# ✅ 预分配
result = np.zeros(1000)
for i in range(1000):
    result[i] = calculate_value(i)

3. 利用广播机制：
合理使用广播可以避免不必要的数据复制：

# 将一维数组广播到二维数组
data = np.random.rand(5, 3)
row_means = data.mean(axis=1, keepdims=True)
normalized = data - row_means  # 广播减法

4. 使用掩码数组处理缺失值：

data = np.array([1, 2, np.nan, 4, 5])
masked_data = np.ma.masked_invalid(data)
mean_value = masked_data.mean()  # 自动忽略NaN值

注意事项

当处理超过内存大小的数据时，考虑使用内存映射文件（np.memmap）
在多线程环境中使用 NumPy 时要注意 GIL（全局解释器锁）的影响
对于超大规模数据，考虑使用 Dask 或 Spark 等分布式计算框架
定期检查 NumPy 版本更新，新版本通常包含性能优化和新功能

6. 进阶指引

掌握了 NumPy 的基础用法后，你可以探索以下高级特性和相关生态：

高级功能

结构化数组： 允许存储异构数据，类似数据库表格

dt = np.dtype([('name', 'U10'), ('age', 'i4'), ('salary', 'f8')])
employees = np.array([('张三', 30, 8000.5), ('李四', 25, 6500.0)], dtype=dt)

ufunc（通用函数）： 自定义向量化函数

def custom_operation(x, y):
    return x * 2 + y ** 2

vectorized_func = np.frompyfunc(custom_operation, 2, 1)
result = vectorized_func(arr1, arr2)

生态扩展

Pandas： 构建在 NumPy 之上的数据分析库，提供更高级的数据结构和分析工具
SciPy： 科学计算工具集，包含优化、积分、线性代数等功能
Matplotlib： 基于 NumPy 数组的绘图库，与 NumPy 无缝集成
Scikit-learn： 机器学习库，其核心算法都依赖 NumPy 数组

学习路径

深入理解数组操作： 掌握高级索引、排序、形状操作等
学习线性代数： 深入理解矩阵运算、特征值、奇异值分解等
性能优化： 学习如何编写高效的 NumPy 代码，避免性能陷阱
专业领域应用： 根据需要深入学习信号处理、图像处理、金融计算等领域的 NumPy 应用

标签 NumPy 下的文章

【技术实操】加密资产量化交易 5 步实现：从数据到实盘的完整指南

Matplotlib 入门指南：让数据"开口说话"的魔法库

目录

1. 库的概览与核心价值

2. 环境搭建与"Hello, World"

安装说明

最简示例

逐行解释

解决中文显示问题

3. 核心概念解析

3.1 Figure（画布）

3.2 Axes（坐标轴/子图）

3.3 Axis（坐标轴对象）

3.4 Artist（艺术家对象）

核心概念关系图

4. 实战演练：分析电影评分趋势

需求分析

方案设计

完整代码实现

运行说明

结果展示

5. 最佳实践与常见陷阱

常见错误及规避方法

错误1：混淆 Figure 和 Axes

错误2：保存图表的顺序错误

错误3：中文显示乱码

错误4：误解 figsize 的单位

最佳实践建议

6. 进阶指引

高级功能

生态扩展

学习资源

学习路径建议

[源码解析]网格交易总亏钱?试着用Python复现Avellaneda-Stoikov做市模型

NumPy技术文档：科学计算的基石

目录

1. 库的概览与核心价值

2. 环境搭建与"Hello, World"

安装说明

Hello, World 示例

3. 核心概念解析

3.1 ndarray：多维数组对象

3.2 广播机制

3.3 向量化运算

4. 实战演练：解决一个典型问题

需求分析

方案设计

代码实现

运行说明

结果展示

5. 最佳实践与常见陷阱

常见错误与规避方法

错误1：数据类型不一致导致的精度丢失

错误2：数组视图与拷贝混淆

错误3：不合理的循环使用

最佳实践建议

注意事项

6. 进阶指引

高级功能

生态扩展

学习路径

推荐资源

最新文章

最近回复

分类

归档

其它

错误1：混淆 `Figure` 和 `Axes`

错误4：误解 `figsize` 的单位