数据类型

KirinX90/Kirin9030除了API不支持bfloat16_t，MrgSort、Mmad基础api（如不支持float等）、Cast基础API（如不支持s64）等部分API还存在其它数据类型差异，详见《Ascend C算子接口》。若开发者在Ascend910B/Ascend910C使用bfloat16_t数据类型，在Kirin平台上需要替换成其它数据类型（比如half）。

表1 数据类型差异兼容说明

基础API	兼容说明
ToBfloat16、ToFloat	不支持功能和bfloat16_t数据类型绑定的接口
GatherMask、Cast、Duplicate、Brcb、Gather、Copy、DataCopy	不支持bfloat16_t数据类型
Sort32、MrgSort、Mmad	不支持float数据类型
SetHF32Mode、SetHF32TransMode	不支持HF32模式
InitConstValue	不支持bfloat16_t、float、int32_t、uint32_t数据类型
LoadData、Fixpipe	不支持bfloat16_t、float数据类型
Cast	详见《Ascend C算子接口》
DataCopy: L1 Buffer->Bias Table	KirinX90/Kirin9030只支持fp16数据类型，且排布方式有差异，详见数据搬运。

针对数据类型有差异的情况，建议开发者采用如下编程方式，支撑同一份算子代码在不同芯片平台执行：

方式1：将数据类型作为算子模板参数传入，参见Tiling模板编程。
方式2：通过适当的NPU_ARCH 编译宏隔离，在算子Kernel中使用using关键字实现数据类型参数化编程。以基础API Mmad为例。

    /* Step1: 参数化数据类型 */
#if defined(__NPU_ARCH__) && (__NPU_ARCH__ == 2201)
    using L0cDtype = float
#endif
#if defined(__NPU_ARCH__) && (__NPU_ARCH__ == 3003 || __NPU_ARCH__ == 3113)
    using L0cDtype = half
#endif
    // ...
    /* Step2： 各平台，归一化编程 */
    // kernel 分配内存大小举例
    tPipe->InitBuffer(l0cQue, tiling.dbL0c, tiling.baseM * tiling.baseN * sizeof(L0cDtype));
    // ...
    // kerenl mmad计算api举例
    mmad<L0cDtype, L0aDtype, L0bDtype, BiasDtype>(dstLocal, fmLocal, filterLocal, biasLocal, mmadParams);

各产品对应的NPU_ARCH，请参见概述中表1产品型号和__NPU_ARCH__的对应关系。
若数据类型差异影响算子输入和输出数据类型，建议采用方式1。
若只是算子中间的计算数据类型有差异，建议采用方式2。