跳到主要内容

Vision Kit简介

Vision Kit(场景化视觉服务)集成了视觉类AI能力,包括人脸活体检测(interactiveLiveness)能力、卡证识别(CardRecognition)能力、文档扫描(DocumentScanner)能力、AI识图控件(visionImageAnalyzer)能力。人脸活体检测能力便于用户与设备进行互动,验证用户是否为真实活体;卡证识别能力可提供身份证、行驶证、驾驶证、护照、银行卡等证件的结构化识别服务;文档扫描控件可提供拍摄文档并转换为高清扫描件的服务;AI识图控件可提供场景化的文本识别、主体分割、识图搜索功能。其中动作活体检测能力、卡证识别能力实施试用期免费的计费政策,试用期至2026年12月31日。开始正式收费前,华为将会提前通过正式途径发布计费调整通告。

场景介绍

Vision Kit提供了人脸活体检测能力、卡证识别能力、文档扫描能力和AI识图能力,具体如下:

  • 人脸活体检测:通过动作活体检测,验证用户是否为真实活体。
  • 卡证识别:多证件的结构化识别服务。
  • 文档扫描:提供拍摄文档并转换为高清扫描件的服务。
  • AI识图:提供场景化的文本识别、主体分割、识图搜索功能。

约束与限制

支持的设备

能力支持的设备
人脸活体检测Phone、Tablet。
卡证识别Phone、Tablet。
文档扫描Phone、Tablet。
AI识图Phone、Tablet、PC/2in1。

支持的国家/地区

仅适用于中国境内(香港特别行政区、澳门特别行政区、中国台湾除外)。

能力限制

AI能力约束
人脸活体检测- 支持的文本语种类型:简体中文、繁体中文、英文、维吾尔文、藏文。 - 支持的播报语种类型:简体中文、英文。 - 人脸活体检测服务暂不支持横屏、分屏进行检测。
卡证识别- 支持的语种类型:简体中文、英文。 - 卡证识别暂时只支持中国二代身份证、中国国内银行卡、中国护照、中国驾驶证、中国行驶证(暂不支持中国港澳台地区及海外证件)。 - 卡证需要保持与真实证件一致的长宽比、没有形变、正向拍摄角度小于30度。 - 卡证图像清晰、完整。无摩尔纹、无遮挡、无反光、无卡套。 - 不允许被其他组件或窗口遮挡。
文档扫描- 支持的语种类型:简体中文、英文。 - 文档扫描暂时只支持phone、tablet设备。 - 不允许被其他组件或窗口遮挡。
AI识图- 支持的文本语种类型:简体中文、繁体中文、英文、维吾尔文、藏文。 - 支持图片最小规格100*100分辨率。 - 分析图像要求是静态非矢量图,即svg、gif等图像类型不支持分析,支持传入PixelMap进行分析,目前仅支持RGBA_8888类型。 - 支持翻译的图片宽高最小比例为1:3(高度小于宽度的3倍),支持文本识别的图片宽高最小比例为1:7(高度小于宽度的7倍)。 - 支持的设备情况请参见约束与限制

模拟器支持情况

本kit暂不支持模拟器。