Data Augmentation Kit简介

Data Augmentation Kit（数据增强套件）提供知识库、知识检索、RAG（检索增强生成）、端侧问答模型能力，打造个性化智慧数据平台，实现个性化智慧体验。

能力范围

Data Augmentation Kit提供以下能力：

RAG（检索增强生成）：提供一种结合检索与生成技术的自然语言处理技术，通过动态从外部知识库中检索相关信息，辅助生成更准确、可靠的文本内容。其核心目标是弥补传统生成模型依赖静态知识的不足，实现“知识实时调用”与“内容灵活生成”的融合。
智慧化数据检索：基于多路召回和重排序，提供了一套知识检索框架。在提供基于倒排索引的传统文本检索的同时，也提供了基于向量索引的语义检索能力。
端侧问答模型：提供接入端侧模型问答的方法，以及使用鸿蒙AI模型管家对接LLM，对用户问题进行处理的过程，实现数据不出端智能问答的效果。

LLM：Large Language Model（大语言模型）是一种基于深度学习的人工智能模型，通过在海量文本数据上训练，掌握语言规律，能够理解和生成人类语言。
chunk：chunk是知识加工时，文本被拆分后的逻辑或结构单元，目前一个chunk默认包含3072个字符（1个字符指1个汉字或1个英文字母）。
检索召回：通过一种特定的策略或算法从海量数据中快速筛选出候选结果集。

Data Augmentation Kit仅支持中国境内（香港特别行政区、澳门特别行政区、中国台湾除外）。

本Kit适用设备情况如下。

本Kit暂不支持模拟器。