快速入门:将生成式搜索 (RAG) 与 Azure AI 搜索中的上下文关联数据配合使用

本快速入门介绍如何将查询发送到大型语言模型 (LLM),以基于 Azure AI 搜索中的索引内容进行对话式搜索体验。 你将使用 Azure 门户设置资源,然后运行 Python 代码来调用 API。

先决条件

下载文件

从 GitHub 下载 Jupyter 笔记本以发送本快速入门中所述的请求。 有关详细信息,请参阅从 GitHub 下载文件

你还可以在本地系统上启动一个新文件,并根据本文中的说明手动创建请求。

配置访问权限

搜索终结点的请求必须经过身份验证和授权。 你可以使用 API 密钥或角色来完成此任务。 密钥更容易上手,但角色更安全。 本快速入门将使用角色。

你将设置两个客户端,因此需要拥有对两个资源的权限。

Azure AI 搜索正在从本地系统接收查询请求。 向你自己分配该任务的搜索索引数据读者角色分配。 如果还要创建和加载酒店示例索引,则另请添加搜索服务参与者和搜索索引数据参与者角色。

除接受来自搜索服务的搜索结果(源)以外,Azure OpenAI 还将接收来自本地系统的“是否可以推荐几个酒店”(查询)。 向你自己和搜索服务分配认知服务 OpenAI 用户角色。

  1. 登录到 Azure 门户

  2. 配置 Azure AI 搜索以使用系统分配的托管标识,以便你可以为其分配角色分配:

    1. 在 Azure 门户上找到你的搜索服务

    2. 在左侧菜单中,选择“设置”>“标识”

    3. 在“系统分配”选项卡上,将状态设置为“打开”

  3. 为 Azure AI 搜索配置基于角色的访问:

    1. 在 Azure 门户中,找到你的 Azure AI 搜索服务。

    2. 在左侧菜单中选择“设置”>“密钥”,然后选择“基于角色的访问控制”或“两者”

  4. 分配角色:

    1. 在左侧菜单中,选择“访问控制 (IAM)”。

    2. 在 Azure AI 搜索上,请确保你有权创建、加载和查询搜索索引:

      • 搜索索引数据读取者
      • 搜索索引数据参与者
      • 搜索服务参与者
    3. 在 Azure OpenAI 上,选择“访问控制 (IAM)”为自己分配 Azure OpenAI 的搜索服务标识权限。 本快速入门的代码在本地运行。 对 Azure OpenAI 的请求源自你的系统。 此外,搜索引擎的搜索结果将传递到 Azure OpenAI。 由于这些原因,你和搜索服务都需要拥有 Azure OpenAI 的权限。

      • 认知服务 OpenAI 用户

权限可能需要几分钟才能生效。

创建索引

我们建议使用 hotels-sample-index,此索引在几分钟内即可创建完成,并可在任何搜索服务层级上运行。 此索引是使用内置示例数据创建的。

  1. 在 Azure 门户上找到你的搜索服务

  2. 在“概述”主页上,选择“导入数据”以启动向导

  3. 在“连接到数据”页面上,从下拉列表中选择“示例”

  4. 选择“hotels-sample”

  5. 在剩余页面中选择“下一步”,并接受默认值

  6. 创建索引后,从左侧菜单中选择“搜索管理”>“索引”以打开索引

  7. 选择“编辑 JSON”。

  8. 搜索“semantic”以在索引中查找语义配置部分。 将空 "semantic": {} 行替换为以下语义配置。 此示例指定了 "defaultConfiguration",它对于运行本快速入门非常重要。

    "semantic": {
    "defaultConfiguration": "semantic-config",
    "configurations": [
        {
        "name": "semantic-config",
        "prioritizedFields": {
            "titleField": {
            "fieldName": "HotelName"
            },
            "prioritizedContentFields": [
            {
                "fieldName": "Description"
            }
            ],
            "prioritizedKeywordsFields": [
            {
                "fieldName": "Category"
            },
            {
                "fieldName": "Tags"
            }
            ]
        }
      }
    ]
    },
    
  9. 保存所做更改。

  10. 搜索资源管理器中运行以下查询以测试索引:hotels near the ocean with beach access and good views

    输出应类似于以下示例。 搜索引擎直接返回的结果由字段及其逐字值以及搜索分数、语义排名分数和标题等元数据(如果使用语义排序器)组成。

       "@search.score": 5.600783,
       "@search.rerankerScore": 2.4191176891326904,
       "@search.captions": [
         {
           "text": "Contoso Ocean Motel. Budget. pool\r\nair conditioning\r\nbar. Oceanfront hotel overlooking the beach features rooms with a private balcony and 2 indoor and outdoor pools. Various shops and art entertainment are on the boardwalk, just steps away..",
           "highlights": "Contoso Ocean Motel. Budget.<em> pool\r\nair conditioning\r\nbar. O</em>ceanfront hotel overlooking the beach features rooms with a private balcony and 2 indoor and outdoor pools. Various shops and art entertainment are on the boardwalk, just steps away."
         }
       ],
       "HotelId": "41",
       "HotelName": "Contoso Ocean Motel",
       "Description": "Oceanfront hotel overlooking the beach features rooms with a private balcony and 2 indoor and outdoor pools. Various shops and art entertainment are on the boardwalk, just steps away.",
       "Category": "Budget",
       "Tags": [
         "pool",
         "air conditioning",
         "bar"
       ],
    

获取服务终结点

在其余部分中,设置对 Azure OpenAI 和 Azure AI 搜索的 API 调用。 获取服务终结点,以便可以在代码中将其作为变量提供。

  1. 登录到 Azure 门户

  2. 查找搜索服务

  3. 在“概述”主页上,复制 URL。 示例终结点可能类似于 https://example.search.azure.cn

  4. 查找 Azure OpenAI 服务

  5. 在“概述”主页上,选择用于查看终结点的链接。 复制 URL。 示例终结点可能类似于 https://example.openai.azure.com/

设置查询和聊天线程

本部分使用 Visual Studio Code 和 Python 在 Azure OpenAI 中调用聊天完成 API。

  1. 启动 Visual Studio Code 并打开 .ipynb 文件或创建新的 Python 文件。

  2. 安装以下 Python 包。

    ! pip install azure-search-documents==11.6.0b4 --quiet
    ! pip install azure-identity==1.16.0 --quiet
    ! pip install openai --quiet
    ! pip intall aiohttp --quiet
    
  3. 设置以下变量,并将占位符替换为在上一步中收集的终结点。

     AZURE_SEARCH_SERVICE: str = "PUT YOUR SEARCH SERVICE ENDPOINT HERE"
     AZURE_OPENAI_ACCOUNT: str = "PUT YOUR AZURE OPENAI ENDPOINT HERE"
     AZURE_DEPLOYMENT_MODEL: str = "gpt-35-turbo"
    
  4. 运行以下代码以设置查询参数。 查询是使用语义排名的关键字搜索。 在关键字搜索中,搜索引擎最多返回 50 个匹配项,但仅向模型提供前 5 个匹配项。

    # Set query parameters for grounding the conversation on your search index
     search_type="text"
     use_semantic_reranker=True
     sources_to_include=5
    
  5. 设置客户端、提示、查询和响应。

    # Set up the query for generating responses
     from azure.identity import DefaultAzureCredential
     from azure.identity import get_bearer_token_provider
     from azure.search.documents import SearchClient
     from openai import AzureOpenAI
    
     credential = DefaultAzureCredential()
     token_provider = get_bearer_token_provider(credential, "https://cognitiveservices.azure.com/.default")
     openai_client = AzureOpenAI(
         api_version="2024-06-01",
         azure_endpoint=AZURE_OPENAI_ACCOUNT,
         azure_ad_token_provider=token_provider
     )
    
     search_client = SearchClient(
         endpoint=AZURE_SEARCH_SERVICE,
         index_name="hotels-sample-index",
         credential=credential
     )
    
     # This prompt provides instructions to the model
     GROUNDED_PROMPT="""
     You are a friendly assistant that recommends hotels based on activities and amenities.
     Answer the query using only the sources provided below in a friendly and concise bulleted manner.
     Answer ONLY with the facts listed in the list of sources below.
     If there isn't enough information below, say you don't know.
     Do not generate answers that don't use the sources below.
     Query: {query}
     Sources:\n{sources}
     """
    
     # Query is the question being asked. It's sent to the search engine and the LLM.
     query="Can you recommend a few hotels near the ocean with beach access and good views"
    
     # Set up the search results and the chat thread.
     # Retrieve the selected fields from the search index related to the question.
     search_results = search_client.search(
         search_text=query,
         top=5,
         select="Description,HotelName,Tags"
     )
     sources_formatted = "\n".join([f'{document["HotelName"]}:{document["Description"]}:{document["Tags"]}' for document in search_results])
    
     response = openai_client.chat.completions.create(
         messages=[
             {
                 "role": "user",
                 "content": GROUNDED_PROMPT.format(query=query, sources=sources_formatted)
             }
         ],
         model=AZURE_DEPLOYMENT_MODEL
     )
    
     print(response.choices[0].message.content)
    

    输出来自 Azure OpenAI,其中包含多个酒店的建议。 下面是此输出的执行示例:

    Based on your criteria, we recommend the following hotels:
    
    - Contoso Ocean Motel: located right on the beach and has private balconies with ocean views. They also have indoor and outdoor pools. It's located on the boardwalk near shops and art entertainment.
    - Northwind Plaza & Suites: offers ocean views, free Wi-Fi, full kitchen, and a free breakfast buffet. Although not directly on the beach, this hotel has great views and is near the aquarium. They also have a pool.
    
    Several other hotels have views and water features, but do not offer beach access or views of the ocean.
    

    如果收到“已禁止”错误消息,请检查 Azure AI 搜索配置,以确保已启用基于角色的访问。

    如果收到“授权失败”错误消息,请等待几分钟,然后重试。 可能需要几分钟才能使角色分配生效。

    否则,如果要进一步试验,请更改查询并重新运行上一步,以更好地了解模型如何处理基础数据。

    你还可以修改提示以更改输出的语气或结构。

    还可以通过在查询参数步骤中设置 use_semantic_reranker=False 来尝试没有语义排名的查询。 语义排名可以显著改善查询结果的相关性以及 LLM 返回有用信息的能力。 试验可以帮助你确定它是否对内容有影响。

清理

在自己的订阅中操作时,最好在项目结束时确定是否仍需要已创建的资源。 持续运行资源可能会产生费用。 可以逐个删除资源,也可以删除资源组以删除整个资源集。

可以在门户中使用最左侧窗格中的“所有资源”或“资源组”链接来查找和管理资源。

另请参阅