# 探索 Edge Craft RAG

[English](Explore_Edge_Craft_RAG.md)

## 在 UI 中使用 LLM 进行 ChatQnA 示例

### 创建流水线

要创建默认流水线，请在 `Pipeline Setting`（流水线设置）页面点击 `Create Pipeline` 按钮。
![alt text](../assets/img/Explore_Edge_Craft_RAG_01.jpg)

然后，在 `Generator`（生成器）配置页面，将 LLM Inference Type 选择为 `Vllm`。  
在 `Large Language Model` 字段中输入您的 LLM 模型名称，例如 `Qwen/Qwen3-8B`。  
在 `Vllm Url` 字段中输入 `IP:vllm_port`，然后点击 `Test` 按钮。注意 vllm_port 默认为 `8086`。  
（注意：如果测试失败，可能是因为 vLLM 服务尚未就绪，可等待 30 秒后重试。）
![alt text](../assets/img/Explore_Edge_Craft_RAG_02.jpg)

您也可以通过 `Operation` 字段创建多条流水线或更新/删除已有流水线，但请注意处于激活状态的流水线无法被更新。
![alt text](../assets/img/Explore_Edge_Craft_RAG_03.jpg)

### 上传文件与 ChatQnA

流水线创建完成后，前往 `Knowledge Base`（知识库）页面，点击 `Create Knowledge Base` 按钮创建知识库。
![alt text](../assets/img/Explore_Edge_Craft_RAG_04.jpg)

然后按照 UI 中的知识库创建向导进行配置。请注意，在 `Indexer Type`（索引器类型）中可以选择 MilvusVector 作为索引器（请确保在选择 MilvusVector 之前已启用 Milvus，可参考 [启用 Milvus](Advanced_Setup_zh.md#使用-docker-compose-在-intel-gpu-上部署服务)）。  
如果选择 MilvusVector，需要先验证向量数据库 URI，请输入 `Your_IP:milvus_port`，然后点击 `Test` 按钮。注意 milvus_port 默认为 19530。
![alt text](../assets/img/Explore_Edge_Craft_RAG_05.jpg)

创建知识库时，请选择 `Activated`（激活）选项，只有处于激活状态的知识库中的文件才能在 ChatQnA 中被检索。
![alt text](../assets/img/Explore_Edge_Craft_RAG_06.jpg)

知识库创建完成后，即可上传用于检索的文档。
![alt text](../assets/img/Explore_Edge_Craft_RAG_07.jpg)

然后，在 `Chat` 页面的聊天框中提交您的问题。
![alt text](../assets/img/Explore_Edge_Craft_RAG_08.jpg)

## 在 UI 中使用 Kbadmin 进行 ChatQnA

### Kbadmin 知识库

流水线创建完成后，前往 `Knowledge Base` 页面，点击 `Create Knowledge Base` 按钮创建知识库。  
请在 `Type` 中选择 `kbadmin`，并从 kbadmin UI 页面中已创建的知识库列表中选择 kb 名称。加载kb名称可能比较耗时，请耐心等待。

![alt text](../assets/img/Explore_Edge_Craft_RAG_09.png)

在 `Indexer` 页面，填写 Embedding 服务和向量数据库信息，注意 Embedding 服务端口为 13020，向量数据库端口为 29530。

![alt text](../assets/img/Explore_Edge_Craft_RAG_10.png)

然后，在 `Chat` 页面的聊天框中提交您的问题。
![alt text](../assets/img/Explore_Edge_Craft_RAG_11.png)