华为昇腾挑战赛南京大学专场-赛前培训
Day 1
基本照着 AscendC 文档讲。主要内容是一些入门知识。
Day 2
算子生成 run 包注意事项
要改两个点:
- 芯片改成
ascend910b
- 改 Cann 包路径
msopgen 在哪
在 toolkit 的 Python package 里面。
考题
ScatterReduce
Gather
Gather Api
取 from_idx 的数据,放到 to_idx 位置。
Tiling key
对于不同输入 shape,可能有不同的 tiling 逻辑。如果在 device 端进行判断,会造成比较大的开销(因为 GPU 不适合干这个事)。所以在 CPU 里提前判断并设置好 tiling key,device 侧只需根据 tiling key 判断就可以了。
图没截到 QAQ
Workspace
是 gm 上的一块内存。分为系统 workspace 和用户 workspace。
在计算过程中需要的临时 gm 存储空间就从用户 workspace 来。
设置 workspace 为 0 时,系统会自动帮你申请系统 workspace,用户 workspace 为 0;否则,你需要同时手动设置系统和用户 workspace。
btw, workspace 在 tiling 函数中设置。