跳到主要内容

TPosition

AscendC管理不同层级的物理内存时,用一种抽象的逻辑位置(TPosition)来表达各级别的存储,代替了片上物理存储的概念,达到隐藏硬件架构的目的。主要的TPosition类型包括:VECIN、VECOUT、VECCALC、A1、A2、B1、B2、CO1、CO2,其中VECIN、VECCALC、VECOUT主要用于矢量编程,A1、A2、B1、B2、C1、C2、CO1、CO2用于矩阵编程。开发者可以参考了解TPosition的基础概念,通过通用约束表1了解TPosition和物理存储的映射关系。

TPosition定义如下。

enum class TPosition : uint8_t {
GM,
A1,
A2,
B1,
B2,
C1,
C2,
CO1,
CO2,
VECIN,
VECOUT,
VECCALC,
LCM = VECCALC,
SPM,
SHM = SPM,
TSCM,
C2PIPE2GM,
C2PIPE2LOCAL,
MAX,
};

TPosition枚举值的具体定义如下。

表1 TPosition枚举值含义说明

枚举值具体含义
GMGlobal Memory,对应AI Core的外部存储。
VECIN用于矢量计算,搬入数据的存放位置,在数据搬入Vector计算单元时使用此位置。
VECOUT用于矢量计算,搬出数据的存放位置,在将Vector计算单元结果搬出时使用此位置。
VECCALC用于矢量计算/矩阵计算,在计算需要临时变量时使用此位置。
A1用于矩阵计算,存放整块A矩阵,可类比CPU多级缓存中的二级缓存。
B1用于矩阵计算,存放整块B矩阵,可类比CPU多级缓存中的二级缓存。
C1用于矩阵计算,存放整块Bias矩阵,可类比CPU多级缓存中的二级缓存。
A2用于矩阵计算,存放切分后的小块A矩阵,可类比CPU多级缓存中的一级缓存。
B2用于矩阵计算,存放切分后的小块B矩阵,可类比CPU多级缓存中的一级缓存。
C2用于矩阵计算,存放切分后的小块Bias矩阵,可类比CPU多级缓存中的一级缓存。
CO1用于矩阵计算,存放小块结果C矩阵,可理解为Cube Out。
CO2用于矩阵计算,存放整块结果C矩阵,可理解为Cube Out。
SPM当Unified Buffer内存有溢出风险时,用于Unified Buffer的数据暂存。
TSCMTemp Swap Cache Memory, 用于临时把数据交换到额外空间,进行Matmul运算。
C2PIPE2GM用于存放FIXPIPE量化参数。
C2PIPE2LOCAL预留参数。为后续的功能做保留,开发者暂时无需关注。