【Triton 教程】triton_language.swizzle2d
Triton 是一种用于并行编程的语言和编译器。它旨在提供一个基于 Python 的编程环境,以高效编写自定义 DNN 计算内核,并能够在现代 GPU 硬件上以最大吞吐量运行。 更多 Triton 中文文档可访问 →http://triton.hyper.ai/ *在线运行 Triton 学习教程 链接是:https://hyper.ai/notebooks/35867?utm_source=Distribute&utm_me... 将行主序的 size_i size_j 矩阵的索引转换为每组 size_g* 行的列主序矩阵的索引。 例如, 对 size_i = size_j = 4 和 size_g = 2,它将转换 为triton.language.swizzle2d(i, j, size_i, size_j, size_g) [[0 , 1 , 2 , 3 ],
[4 , 5 , 6 , 7 ],
[8 , 9 , 10, 11],
[12, 13, 14, 15]][[0, 2, 4 , 6 ],
[1, 3, 5 , 7 ],
[8, 10, 12, 14],
[9, 11, 13, 15]]