华为昇腾挑战赛南京大学专场-赛前培训

Day 1

基本照着 AscendC 文档讲。主要内容是一些入门知识。

Day 2

算子生成 run 包注意事项

要改两个点:

  • 芯片改成 ascend910b
  • 改 Cann 包路径

msopgen 在哪

在 toolkit 的 Python package 里面。

考题

ScatterReduce

Gather

Gather Api 取 from_idx 的数据,放到 to_idx 位置。

Tiling key

对于不同输入 shape,可能有不同的 tiling 逻辑。如果在 device 端进行判断,会造成比较大的开销(因为 GPU 不适合干这个事)。所以在 CPU 里提前判断并设置好 tiling key,device 侧只需根据 tiling key 判断就可以了。

图没截到 QAQ

Workspace

是 gm 上的一块内存。分为系统 workspace 和用户 workspace。

在计算过程中需要的临时 gm 存储空间就从用户 workspace 来。

设置 workspace 为 0 时,系统会自动帮你申请系统 workspace,用户 workspace 为 0;否则,你需要同时手动设置系统和用户 workspace。

btw, workspace 在 tiling 函数中设置。