neural_network_runtime.h
概述
Neural Network Runtime模块接口定义,AI推理框架使用Neural Network Runtime提供的Native接口,完成模型构建。
Neural Network Runtime的接口目前均不支持多线程并发调用。
引用文件: <neural_network_runtime/neural_network_runtime.h>
库: libneural_network_runtime.so
系统能力: SystemCapability.AI.NeuralNetworkRuntime
起始版本: 9
相关模块: NeuralNetworkRuntime
汇总
函数
函数说明
OH_NNQuantParam_Create()
NN_QuantParam *OH_NNQuantParam_Create()
描述
创建一个NN_QuantParam量化参数实例。
创建NN_QuantParam量化参数实例后,调用OH_NNQuantParam_SetScales、OH_NNQuantParam_SetZeroPoints或OH_NNQuantParam_SetNumBits设置它的属性值,并调用OH_NNModel_SetTensorQuantParams将它设置到NN_Tensor中。最后再调用OH_NNQuantParam_Destroy销毁它,以避免内存泄露。
起始版本: 11
返回:
| 类型 | 说明 |
|---|---|
| NN_QuantParam * | 指向NN_QuantParam实例的指针,如果创建失败就返回NULL。 |
OH_NNQuantParam_SetScales()
OH_NN_ReturnCode OH_NNQuantParam_SetScales(NN_QuantParam *quantParams, const double *scales, size_t quantCount)
描述
设置NN_QuantParam的缩放系数。
参数quantCount是张量中量化参数的数量,例如对于per-channel量化,quantCount就是通道数量。
起始版本: 11
参数:
| 参数项 | 描述 |
|---|---|
| NN_QuantParam *quantParams | 指向NN_QuantParam实例的指针。 |
| const double *scales | 张量中所有量化参数的缩放系数构成的数组。 |
| size_t quantCount | 张量中量化参数的数量。 |
返回:
| 类型 | 说明 |
|---|---|
| OH_NN_ReturnCode | 函数执行的结果状态。执行成功返回OH_NN_SUCCESS;失败返回具体错误码,具体失败错误码可参考OH_NN_ReturnCode。 |
OH_NNQuantParam_SetZeroPoints()
OH_NN_ReturnCode OH_NNQuantParam_SetZeroPoints(NN_QuantParam *quantParams, const int32_t *zeroPoints, size_t quantCount)
描述
设置NN_QuantParam的零点。
参数quantCount是张量中量化参数的数量,例如对于per-channel量化,quantCount就是通道数量。
起始版本: 11
参数:
| 参数项 | 描述 |
|---|---|
| NN_QuantParam *quantParams | 指向NN_QuantParam实例的指针。 |
| const int32_t *zeroPoints | 张量中所有量化参数的零点构成的数组。 |
| size_t quantCount | 张量中量化参数的数量。 |
返回:
| 类型 | 说明 |
|---|---|
| OH_NN_ReturnCode | 函数执行的结果状态。执行成功返回OH_NN_SUCCESS;失败返回具体错误码,具体失败错误码可参考OH_NN_ReturnCode。 |
OH_NNQuantParam_SetNumBits()
OH_NN_ReturnCode OH_NNQuantParam_SetNumBits(NN_QuantParam *quantParams, const uint32_t *numBits, size_t quantCount)
描述
设置NN_QuantParam的量化位数。
参数quantCount是张量中量化参数的数量,例如对于per-channel量化,quantCount就是通道数量。
起始版本: 11
参数:
| 参数项 | 描述 |
|---|---|
| NN_QuantParam *quantParams | 指向NN_QuantParam实例的指针。 |
| const uint32_t *numBits | 张量中所有量化参数的量化位数构成的数组。 |
| size_t quantCount | 张量中量化参数的数量。 |
返回:
| 类型 | 说明 |
|---|---|
| OH_NN_ReturnCode | 函数执行的结果状态。执行成功返回OH_NN_SUCCESS;失败返回具体错误码,具体失败错误码可参考OH_NN_ReturnCode。 |
OH_NNQuantParam_Destroy()
OH_NN_ReturnCode OH_NNQuantParam_Destroy(NN_QuantParam **quantParams)
描述
销毁NN_QuantParam实例。
当设置NN_QuantParam实例到一个NN_Tensor中后,如果不再使用该实例,需要销毁它以避免内存泄漏。
如果quantParams或*****quantParams****是空指针,那么该接口仅打印警告日志,不会执行销毁操作。
起始版本: 11
参数:
| 参数项 | 描述 |
|---|---|
| NN_QuantParam **quantParams | 指向NN_QuantParam实例的二级指针。 |
返回:
| 类型 | 说明 |
|---|---|
| OH_NN_ReturnCode | 函数执行的结果状态。执行成功返回OH_NN_SUCCESS;失败返回具体错误码,具体失败错误码可参考OH_NN_ReturnCode。 |
OH_NNModel_Construct()
OH_NNModel *OH_NNModel_Construct(void)
描述
创建OH_NNModel类型的模型实例,搭配OH_NNModel模块提供的其他接口,完成模型实例的构造。
在开始构图前,先调用OH_NNModel_Construct创建模型实例,根据模型的拓扑结构,调用OH_NNModel_AddTensorToModel、OH_NNModel_AddOperation和OH_NNModel_SetTensorData方法,填充模型的数据节点和算子节点;然后调用OH_NNModel_SpecifyInputsAndOutputs指定模型的输入和输出;当构造完模型的拓扑结构,调用OH_NNModel_Finish完成模型的构建。
模型实例使用完毕后,需要调用OH_NNModel_Destroy销毁模型实例,避免内存泄漏。
起始版本: 9
返回:
| 类型 | 说明 |
|---|---|
| OH_NNModel * | 返回一个指向OH_NNModel实例的指针,如果创建失败就返回NULL。 |
OH_NNModel_AddTensorToModel()
OH_NN_ReturnCode OH_NNModel_AddTensorToModel(OH_NNModel *model, const NN_TensorDesc *tensorDesc)
描述
向模型实例中添加张量。
Neural Network Runtime模型中的数据节点和算子参数均由模型的张量构成。
该接口根据NN_TensorDesc向model实例中添加张量,张量添加的顺序是模型中记录张量的索引值。OH_NNModel_SetTensorData、OH_NNModel_AddOperation和OH_NNModel_SpecifyInputsAndOutputs接口根据该索引值,指定不同的张量。
Neural Network Runtime支持动态形状的输入和输出张量。在添加动态形状的数据节点时,需要将tensor.dimensions中支持动态变化的维度设置为-1。例如可将一个四维tensor的dimensions设置为[1, -1, 2, 2],表示其第二个维度支持动态变化。
起始版本: 11
参数:
| 参数项 | 描述 |
|---|---|
| OH_NNModel *model | 指向OH_NNModel实例的指针。 |
| const NN_TensorDesc *tensorDesc | NN_TensorDesc张量的指针,NN_TensorDesc指定了添加到模型实例中张量的属性。 |
返回:
| 类型 | 说明 |
|---|---|
| OH_NN_ReturnCode | 函数执行的结果状态。执行成功返回OH_NN_SUCCESS;失败返回具体错误码,具体失败错误码可参考OH_NN_ReturnCode。 |
OH_NNModel_SetTensorData()
OH_NN_ReturnCode OH_NNModel_SetTensorData(OH_NNModel *model, uint32_t index, const void *dataBuffer, size_t length)
描述
设置张量的数值。 对于具有常量值的张量(如模型的权重),需要在构图阶段使用该接口设置数值。
张量的索引值根据张量添加进模型的顺序决定,张量的添加参考OH_NNModel_AddTensorToModel。
起始版本: 9
参数:
| 参数项 | 描述 |
|---|---|
| OH_NNModel *model | 指向OH_NNModel实例的指针。 |
| uint32_t index | 张量的索引值。 |
| const void *dataBuffer | 指向真实数据内存的指针。 |
| size_t length | 数据内存的长度。 |
返回:
| 类型 | 说明 |
|---|---|
| OH_NN_ReturnCode | 函数执行的结果状态。执行成功返回OH_NN_SUCCESS;失败返回具体错误码,具体失败错误码可参考OH_NN_ReturnCode。 |
OH_NNModel_SetTensorQuantParams()
OH_NN_ReturnCode OH_NNModel_SetTensorQuantParams(OH_NNModel *model, uint32_t index, NN_QuantParam *quantParam)
描述
设置张量的量化参数,参考NN_QuantParam。
起始版本: 11
参数:
| 参数项 | 描述 |
|---|---|
| OH_NNModel *model | 指向OH_NNModel实例的指针。 |
| uint32_t index | 张量的索引值。 |
| NN_QuantParam *quantParam | 指向NN_QuantParam的指针。 |
返回:
| 类型 | 说明 |
|---|---|
| OH_NN_ReturnCode | 函数执行的结果状态。执行成功返回OH_NN_SUCCESS;失败返回具体错误码,具体失败错误码可参考OH_NN_ReturnCode。 |
OH_NNModel_SetTensorType()
OH_NN_ReturnCode OH_NNModel_SetTensorType(OH_NNModel *model, uint32_t index, OH_NN_TensorType tensorType)
描述
设置张量的类型,参考OH_NN_TensorType。
起始版本: 11
参数:
| 参数项 | 描述 |
|---|---|
| OH_NNModel *model | 指向OH_NNModel实例的指针。 |
| uint32_t index | 张量的索引值。 |
| OH_NN_TensorType tensorType | 张量类型。 |
返回:
| 类型 | 说明 |
|---|---|
| OH_NN_ReturnCode | 函数执行的结果状态。执行成功返回OH_NN_SUCCESS;失败返回具体错误码,具体失败错误码可参考OH_NN_ReturnCode |
OH_NNModel_AddOperation()
OH_NN_ReturnCode OH_NNModel_AddOperation(OH_NNModel *model,OH_NN_OperationType op,const OH_NN_UInt32Array *paramIndices,const OH_NN_UInt32Array *inputIndices,const OH_NN_UInt32Array *outputIndices)
描述
向模型实例中添加算子。
该接口向模型实例中添加算子,算子类型由op指定,算子的参数、输入和输出由paramIndices、inputIndices和outputIndices指定。
该接口将对算子参数的属性和输入、输出张量的数量进行校验,这些属性需要在调用OH_NNModel_AddTensorToModel添加张量时正确设置。
每个算子期望的参数、输入和输出属性请参考OH_NN_OperationType。
paramIndices、inputIndices和outputIndices中存储的是张量的索引值,每个索引值根据张量添加进模型的顺序决定,正确设置并添加算子要求准确设置每个张量的索引值。
张量的添加参考OH_NNModel_AddTensorToModel。
如果添加算子时,添加了额外的参数(非算子需要的参数),该接口返回OH_NN_INVALID_PARAMETER;如果没有设置算子参数,则算子按默认值设置缺省的参数,默认值请参考OH_NN_OperationType。
起始版本: 9
参数:
| 参数项 | 描述 |
|---|---|
| OH_NNModel *model | 指向OH_NNModel实例的指针。 |
| OH_NN_OperationType op | 指定添加的算子类型,取值请参考OH_NN_OperationType的枚举值。 |
| const OH_NN_UInt32Array *paramIndices | OH_NN_UInt32Array实例的指针,设置算子的参数张量索引。 |
| const OH_NN_UInt32Array *inputIndices | OH_NN_UInt32Array实例的指针,指定算子的输入张量索引。 |
| const OH_NN_UInt32Array *outputIndices | OH_NN_UInt32Array实例的指针,设置算子的输出张量索引。 |
返回:
| 类型 | 说明 |
|---|---|
| OH_NN_ReturnCode | 函数执行的结果状态。执行成功返回OH_NN_SUCCESS;失败返回具体错误码,具体失败错误码可参考OH_NN_ReturnCode。 |
OH_NNModel_SpecifyInputsAndOutputs()
OH_NN_ReturnCode OH_NNModel_SpecifyInputsAndOutputs(OH_NNModel *model,const OH_NN_UInt32Array *inputIndices,const OH_NN_UInt32Array *outputIndices)
描述
指定模型的输入和输出张量的索引值。
模型实例需要指定张量作为端到端的输入和输出张量。设置一个张量为输入或输出张量后,就不能再通过调用OH_NNModel_SetTensorData设置张量数据,而需要在执行阶段调用OH_NNExecutor的方法设置输入或输出张量数据。
张量的索引值根据张量添加进模型的顺序决定,张量的添加参考OH_NNModel_AddTensorToModel。 暂时不支持异步设置模型输入和输出张量。
起始版本: 9
参数:
| 参数项 | 描述 |
|---|---|
| OH_NNModel *model | 指向OH_NNModel实例的指针。 |
| const OH_NN_UInt32Array *inputIndices | OH_NN_UInt32Array实例的指针,指定算子的输入张量。 |
| const OH_NN_UInt32Array *outputIndices | OH_NN_UInt32Array实例的指针,指定算子的输出张量。 |
返回:
| 类型 | 说明 |
|---|---|
| OH_NN_ReturnCode | 函数执行的结果状态。执行成功返回OH_NN_SUCCESS;失败返回具体错误码,具体失败错误码可参考OH_NN_ReturnCode。 |
OH_NNModel_Finish()
OH_NN_ReturnCode OH_NNModel_Finish(OH_NNModel *model)
描述
完成模型构图。
完成模型拓扑结构的搭建后,调用该接口指示构图已完成。
在调用该接口后,无法进行额外的构图操作,调用OH_NNModel_AddTensorToModel、OH_NNModel_AddOperation、OH_NNModel_SetTensorData和OH_NNModel_SpecifyInputsAndOutputs将返回OH_NN_OPERATION_FORBIDDEN。
在调用OH_NNModel_GetAvailableOperations和OH_NNCompilation_Construct之前,必须先调用该接口完成构图。
起始版本: 9
参数:
| 参数项 | 描述 |
|---|---|
| OH_NNModel *model | 指向OH_NNModel实例的指针。 |
返回:
| 类型 | 说明 |
|---|---|
| OH_NN_ReturnCode | 函数执行的结果状态。执行成功返回OH_NN_SUCCESS;失败返回具体错误码,具体失败错误码可参考OH_NN_ReturnCode。 |
OH_NNModel_Destroy()
void OH_NNModel_Destroy(OH_NNModel **model)
描述
销毁模型实例。
调用OH_NNModel_Construct创建的模型实例需要调用该接口主动销毁,否则将造成内存泄漏。
如果model为空指针或者*model为空指针,该接口仅打印警告日志,不执行销毁操作。
起始版本: 9
参数:
| 参数项 | 描述 |
|---|---|
| OH_NNModel **model | 指向OH_NNModel实例的二级指针。模型实例销毁后,该接口会将*model主动设置为空指针。 |
OH_NNModel_GetAvailableOperations()
OH_NN_ReturnCode OH_NNModel_GetAvailableOperations(OH_NNModel *model,size_t deviceID,const bool **isSupported,uint32_t *opCount)
描述
查询硬件对模型内所有算子的支持情况,通过布尔值序列指示支持情况。
查询底层硬件对模型实例内每个算子的支持情况,硬件由deviceID指定,结果将通过isSupported指向的数组表示。
如果支持第i个算子,则(*isSupported)[i] == true,否则为false。 该接口成功执行后,(*isSupported)将指向记录算子支持情况的bool数组,数组长度和模型实例的算子数量相等。
该数组对应的内存由Neural Network Runtime管理,在模型实例销毁或再次调用该接口后自动销毁。
起始版本: 9
参数:
| 参数项 | 描述 |
|---|---|
| OH_NNModel *model | 指向OH_NNModel实例的指针。 |
| size_t deviceID | 指定查询的硬件ID,通过OH_NNDevice_GetAllDevicesID获取。 |
| const bool **isSupported | 指向bool数组的指针。调用该接口时,要求(*isSupported)为空指针,否则返回OH_NN_INVALID_PARAMETER。 |
| uint32_t *opCount | 模型实例中算子的数量,对应(*isSupported)数组的长度。 |
返回:
| 类型 | 说明 |
|---|---|
| OH_NN_ReturnCode | 函数执行的结果状态。执行成功返回OH_NN_SUCCESS;失败返回具体错误码,具体失败错误码可参考OH_NN_ReturnCode。 |
OH_NNModel_AddTensor()
OH_NN_ReturnCode OH_NNModel_AddTensor(OH_NNModel *model, const OH_NN_Tensor *tensor)
描述
向模型实例中添加张量。
Neural Network Runtime模型中的数据节点和算子参数均由模型的张量构成,该接口根据tensor,向model实例中添加张量。
张量添加的顺序由模型中记录张量的索引值来确定,OH_NNModel_SetTensorData、OH_NNModel_AddOperation和OH_NNModel_SpecifyInputsAndOutputs接口根据该索引值,指定不同的张量。
Neural Network Runtime支持动态形状输入和输出。
在添加动态形状的数据节点时,需要将tensor.dimensions中支持动态变化的维度设置为-1。例如可将一个四维tensor的dimensions设置为[1, -1, 2, 2],表示其第二个维度支持动态变化。
起始版本: 9
废弃版本: 11
替代接口: OH_NNModel_AddTensorToModel
参数:
| 参数项 | 描述 |
|---|---|
| OH_NNModel *model | 指向OH_NNModel实例的指针。 |
| const OH_NN_Tensor *tensor | OH_NN_Tensor张量的指针,tensor指定了添加到模型实例中张量的属性。 |
返回:
| 类型 | 说明 |
|---|---|
| OH_NN_ReturnCode | 函数执行的结果状态。执行成功返回OH_NN_SUCCESS;失败返回具体错误码,具体失败错误码可参考OH_NN_ReturnCode。 |
OH_NNExecutor_SetInput()
OH_NN_ReturnCode OH_NNExecutor_SetInput(OH_NNExecutor *executor,uint32_t inputIndex,const OH_NN_Tensor *tensor,const void *dataBuffer,size_t length)
描述
设置模型单个输入的数据。
该接口将dataBuffer中,长度为length个字节的数据,拷贝到底层硬件的共享内存。
inputIndex指定设置的输入,tensor用于设置输入张量的形状、数据类型、量化参数等信息。
由于Neural Network Runtime支持动态输入形状的模型,在固定形状输入和动态形状输入的场景下,该接口采取不同的处理策略:
-
固定形状输入的场景:tensor各属性必须和构图阶段调用OH_NNModel_AddTensor添加的张量保持一致;
-
动态形状输入的场景:在构图阶段,由于动态输入的形状不确定,调用该接口时,要求tensor.dimensions中的每个值必须大于0,以确定执行计算阶段输入的形状。设置形状时,只允许调整数值为-1的维度。
假设在构图阶段,输入A的维度为[-1, 224, 224, 3],调用该接口时,只能调整第一个维度的尺寸,如:[3, 224, 224, 3]。调整其他维度将返回OH_NN_INVALID_PARAMETER。
起始版本: 9
废弃版本: 11
替代接口: OH_NNExecutor_RunSync
参数:
| 参数项 | 描述 |
|---|---|
| OH_NNExecutor *executor | 指向OH_NNExecutor实例的指针。 |
| uint32_t inputIndex | 输入的索引值,与调用OH_NNModel_SpecifyInputsAndOutputs时输入数据的顺序一致。 假设调用OH_NNModel_SpecifyInputsAndOutputs时,inputIndices为{1, 5, 9},则在设置输入的阶段,三个输入的索引值分别为{0, 1, 2}。 |
| const OH_NN_Tensor *tensor | 设置输入数据对应的张量。 |
| const void *dataBuffer | 指向输入数据的指针。 |
| size_t length | 数据内存的字节长度。 |
返回:
| 类型 | 说明 |
|---|---|
| OH_NN_ReturnCode | 函数执行的结果状态。执行成功返回OH_NN_SUCCESS;失败返回具体错误码,具体失败错误码可参考OH_NN_ReturnCode。 |
OH_NNExecutor_SetOutput()
OH_NN_ReturnCode OH_NNExecutor_SetOutput(OH_NNExecutor *executor,uint32_t outputIndex,void *dataBuffer,size_t length)
描述
设置模型单个输出的内存。
该接口将dataBuffer指向的内存与outputIndex指定的输出绑定,内存的长度由length指定。
调用OH_NNExecutor_Run完成单次模型推理后,Neural Network Runtime将比对dataBuffer指向的内存与输出数据的长度,根据不同情况,返回不同结果:
- 如果内存大小大于或等于数据长度:则推理后的结果将拷贝至内存,并返回OH_NN_SUCCESS,可以通过访问dataBuffer读取推理结果。
- 如果内存大小小于数据长度:则OH_NNExecutor_Run将返回OH_NN_INVALID_PARAMETER,并输出日志告知内存太小的信息。
起始版本: 9
废弃版本: 11
替代接口: OH_NNExecutor_RunSync
参数:
| 参数项 | 描述 |
|---|---|
| OH_NNExecutor *executor | 指向OH_NNExecutor实例的指针。 |
| uint32_t outputIndex | 输出的索引值,与调用OH_NNModel_SpecifyInputsAndOutputs时输出数据的顺序一致。 假设调用OH_NNModel_SpecifyInputsAndOutputs时,outputIndices为{4, 6, 8},则在设置输出内存时,三个输出的索引值分别为{0, 1, 2}。 |
| void *dataBuffer | 指向输出数据的指针。 |
| size_t length | 数据内存的字节长度。 |
返回:
| 类型 | 说明 |
|---|---|
| OH_NN_ReturnCode | 函数执行的结果状态。执行成功返回OH_NN_SUCCESS;失败返回具体错误码,具体失败错误码可参考OH_NN_ReturnCode。 |
OH_NNExecutor_Run()
OH_NN_ReturnCode OH_NNExecutor_Run(OH_NNExecutor *executor)
描述
执行推理。 在执行器关联的硬件上,执行模型的端到端推理计算。
起始版本: 9
废弃版本: 11
替代接口: OH_NNExecutor_RunSync
参数:
| 参数项 | 描述 |
|---|---|
| OH_NNExecutor *executor | 指向OH_NNExecutor实例的指针。 |
返回:
| 类型 | 说明 |
|---|---|
| OH_NN_ReturnCode | 函数执行的结果状态。执行成功返回OH_NN_SUCCESS;失败返回具体错误码,具体失败错误码可参考OH_NN_ReturnCode。 |
OH_NNExecutor_AllocateInputMemory()
OH_NN_Memory *OH_NNExecutor_AllocateInputMemory(OH_NNExecutor *executor, uint32_t inputIndex, size_t length)
描述
在硬件上为单个输入申请共享内存。
Neural Network Runtime 提供主动申请硬件共享内存的方法。
通过指定执行器和输入索引值,该接口在单个输入关联的硬件上,申请大小为length的共享内存,通过OH_NN_Memory实例返回。
起始版本: 9
废弃版本: 11
替代接口: OH_NNTensor_CreateWithSize
参数:
| 参数项 | 描述 |
|---|---|
| OH_NNExecutor *executor | 指向OH_NNExecutor实例的指针。 |
| uint32_t inputIndex | 输入的索引值,与调用OH_NNModel_SpecifyInputsAndOutputs时输入数据的顺序一致。 假设调用OH_NNModel_SpecifyInputsAndOutputs时,inputIndices为{1, 5, 9},则在申请输入内存时,三个输入的索引值分别为{0, 1, 2}。 |
| size_t length | 申请的内存字节。 |
返回:
| 类型 | 说明 |
|---|---|
| OH_NN_Memory * | 指向OH_NN_Memory实例的指针,如果创建失败就返回NULL。 |
OH_NNExecutor_AllocateOutputMemory()
OH_NN_Memory *OH_NNExecutor_AllocateOutputMemory(OH_NNExecutor *executor, uint32_t outputIndex, size_t length)
描述
在硬件上为单个输出申请共享内存。
Neural Network Runtime 提供主动申请硬件共享内存的方法。
通过指定执行器和输出索引值,该接口在单个输出关联的硬件上,申请大小为length的共享内存,通过OH_NN_Memory实例返回。
起始版本: 9
废弃版本: 11
替代接口: OH_NNTensor_CreateWithSize
参数:
| 参数项 | 描述 |
|---|---|
| OH_NNExecutor *executor | 指向OH_NNExecutor实例的指针。 |
| uint32_t outputIndex | 输出的索引值,与调用OH_NNModel_SpecifyInputsAndOutputs时输出数据的顺序一致。 假设调用OH_NNModel_SpecifyInputsAndOutputs时,outputIndices为{4, 6, 8},则在申请输出内存时,三个输出的索引值分别为{0, 1, 2}。 |
| size_t length | 申请的内存字节。 |
返回:
| 类型 | 说明 |
|---|---|
| OH_NN_Memory * | 指向OH_NN_Memory实例的指针,如果创建失败就返回NULL。 |
OH_NNExecutor_DestroyInputMemory()
void OH_NNExecutor_DestroyInputMemory(OH_NNExecutor *executor, uint32_t inputIndex, OH_NN_Memory **memory)
描述
释放OH_NN_Memory实例指向的输入内存。
调用OH_NNExecutor_AllocateInputMemory创建的内存实例,需要主动调用该接口进行释放,否则将造成内存泄漏。
inputIndex和memory的对应关系需要和创建内存实例时保持一致。 如果memory或*memory为空指针,该接口仅打印警告日志,不执行释放操作。
起始版本: 9
废弃版本: 11
替代接口: OH_NNTensor_Destroy
参数:
| 参数项 | 描述 |
|---|---|
| OH_NNExecutor *executor | 指向OH_NNExecutor实例的指针。 |
| uint32_t inputIndex | 输入的索引值,与调用OH_NNModel_SpecifyInputsAndOutputs时输入数据的顺序一致。 假设调用OH_NNModel_SpecifyInputsAndOutputs时,inputIndices为{1, 5, 9},则在释放输入内存时,三个输入的索引值分别为{0, 1, 2}。 |
| OH_NN_Memory **memory | 指向OH_NN_Memory实例的二级指针。共享内存释放后,该接口将*memory主动设置为空指针。 |
OH_NNExecutor_DestroyOutputMemory()
void OH_NNExecutor_DestroyOutputMemory(OH_NNExecutor *executor, uint32_t outputIndex, OH_NN_Memory **memory)
描述
释放OH_NN_Memory实例指向的输出内存。
调用OH_NNExecutor_AllocateOutputMemory创建的内存实例,需要主动调用该接口进行释放,否则将造成内存泄漏。
outputIndex和memory的对应关系需要和创建内存实例时保持一致。
如果memory或*memory为空指针,该接口仅打印警告日志,不执行释放操作。
起始版本: 9
废弃版本: 11
替代接口: OH_NNTensor_Destroy
参数:
| 参数项 | 描述 |
|---|---|
| OH_NNExecutor *executor | 指向OH_NNExecutor实例的指针。 |
| uint32_t outputIndex | 输出的索引值,与调用OH_NNModel_SpecifyInputsAndOutputs时输出数据的顺序一致。 假设调用OH_NNModel_SpecifyInputsAndOutputs时,outputIndices为{4, 6, 8},则在释放输出内存时,三个输出的索引值分别为{0, 1, 2}。 |
| OH_NN_Memory **memory | 指向OH_NN_Memory实例的二级指针。共享内存释放后,该接口将*memory主动设置为空指针。 |
OH_NNExecutor_SetInputWithMemory()
OH_NN_ReturnCode OH_NNExecutor_SetInputWithMemory(OH_NNExecutor *executor,uint32_t inputIndex,const OH_NN_Tensor *tensor,const OH_NN_Memory *memory)
描述
将OH_NN_Memory实例指向的硬件共享内存,并指定为单个输入使用的内存。
在需要自行管理内存的场景下,该接口将执行输入和OH_NN_Memory内存实例绑定。
执行计算时,底层硬件从内存实例指向的共享内存中读取输入数据。
通过该接口,可以实现设置输入、执行计算、读取输出的并发执行,提升数据流的推理效率。
起始版本: 9
废弃版本: 11
替代接口: OH_NNExecutor_RunSync
参数:
| 参数项 | 描述 |
|---|---|
| OH_NNExecutor *executor | 指向OH_NNExecutor实例的指针。 |
| uint32_t inputIndex | 输入的索引值,与调用OH_NNModel_SpecifyInputsAndOutputs时输入数据的顺序一致。 假设调用OH_NNModel_SpecifyInputsAndOutputs时,inputIndices为{1, 5, 9},则在指定输入的共享内存时,三个输入的索引值分别为{0, 1, 2}。 |
| const OH_NN_Tensor *tensor | 指向OH_NN_Tensor的指针,设置单个输入所对应的张量。 |
| const OH_NN_Memory *memory | 指向OH_NN_Memory的指针。 |
返回:
| 类型 | 说明 |
|---|---|
| OH_NN_ReturnCode | 函数执行的结果状态。执行成功返回OH_NN_SUCCESS;失败返回具体错误码,具体失败错误码可参考OH_NN_ReturnCode。 |
OH_NNExecutor_SetOutputWithMemory()
OH_NN_ReturnCode OH_NNExecutor_SetOutputWithMemory(OH_NNExecutor *executor,uint32_t outputIndex,const OH_NN_Memory *memory)
描述
将OH_NN_Memory实例指向的硬件共享内存,并指定为单个输出使用的内存。
在需要自行管理内存的场景下,该接口将执行输出和OH_NN_Memory内存实例绑定。
执行计算时,底层硬件将计算结果直接写入内存实例指向的共享内存。
通过该接口,可以实现设置输入、执行计算、读取输出的并发执行,提升数据流的推理效率。
起始版本: 9
废弃版本: 11
替代接口: OH_NNExecutor_RunSync
参数:
| 参数项 | 描述 |
|---|---|
| OH_NNExecutor *executor | 执行器。 |
| uint32_t outputIndex | 输出的索引值,与调用OH_NNModel_SpecifyInputsAndOutputs时输出数据的顺序一致。 假设调用OH_NNModel_SpecifyInputsAndOutputs时,outputIndices为{4, 6, 8},则在指定输出的共享内存时,三个输出的索引值分别为{0, 1, 2}。 |
| const OH_NN_Memory *memory | 指向OH_NN_Memory的指针。 |
返回:
| 类型 | 说明 |
|---|---|
| OH_NN_ReturnCode | 函数执行的结果状态。执行成功返回OH_NN_SUCCESS;失败返回具体错误码,具体失败错误码可参考OH_NN_ReturnCode。 |