入门:文档智能工作室

此内容适用于:选中标记v3.1 (GA) | 以前的版本:蓝色复选标记 v3.0 (GA)

文档智能工作室是一种联机工具,用于在应用程序中通过文档智能服务直观地浏览、了解和集成功能。 若要开始使用,你可以使用示例或你自己的文档来探索预先训练过的模型。 你还可以通过 Python SDK 和其他快速入门,创建项目来生成自定义模板模型,并在应用程序中引用这些模型。

适用于新用户的先决条件

若要使用文档智能工作室,需要以下资产和设置:

提示

如果计划通过一个终结点/密钥访问多个 Azure AI 服务,请创建 Azure AI 服务资源。 请创建仅供文档智能访问的文档智能资源。 请注意,如果你打算使用 Microsoft Entra 身份验证,则需要单一服务资源。

文档智能现在支持在访问文档智能资源和存储帐户时进行本地(基于密钥)身份验证的 AAD 令牌身份验证。 请务必按照以下说明设置正确的访问角色,尤其是在使用 DisableLocalAuth 策略应用资源时。

  • 正确限定范围的 Azure 角色分配对于文档分析和预生成模型,需要针对不同的方案执行以下角色分配。

    • 基础✔️ 认知服务用户:需要此角色来访问文档智能或 Azure AI 服务资源以进入分析页面。

    • 高级✔️ 参与者:需要此角色来创建资源组、文档智能服务或 Azure AI 服务资源。

      有关授权的详细信息,请参阅 文档智能工作室授权策略

      注意

      如果对文档智能服务资源禁用本地(基于密钥)身份验证,请确保获取认知服务用户角色,并且 AAD 令牌将用于对 Document Intelligence Studio 上的请求进行身份验证。 参与者角色仅允许列出密钥,但不允许在禁用密钥访问时使用资源。

  • 完成资源配置后,可以试用文档智能工作室提供的不同模型。 在首页中选择任何文档智能模型以尝试使用无代码方法。

  • 要测试任何文档分析或预生成模型,请选择模型并使用一个示例文档或上传自己的文档进行分析。 分析结果显示在“内容”-“结果”-“代码”窗口的右侧。

  • 需要在文档中训练自定义模型。 有关自定义模型的概述,请参阅自定义模型概述

身份验证

导航到“文档智能工作室”。 如果是首次登录,将显示一个弹出窗口,提示你配置服务资源。 根据组织的策略,可以使用一个或两个选项:

  • Microsoft Entra 身份验证:按资源授予访问权限(建议)

    • 选择现有订阅。

    • 选择订阅中的现有资源组或创建新资源组。

    • 选择现有的文档智能或 Azure AI 服务资源。

      在文档智能工作室中配置服务资源表单的屏幕截图。

  • 本地身份验证:按 API 终结点和密钥授予访问权限

    • 从 Azure 门户检索终结点和密钥。

    • 转到资源的概述页,从左侧导航栏中选择“密钥和终结点”。

    • 在适当的字段中输入值。

      Azure 门户中的密钥和终结点页面的屏幕截图。

  • 在文档智能工作室中验证方案之后,请使用 C#JavaJavaScriptPython 客户端库或 REST API 开始将文档智能模型合并到自己的应用程序中。

若要详细了解每种模型,请参阅概念页面

查看资源详细信息

要查看资源详细信息(如名称和定价层),请选择文档智能工作室主页右上角的“设置”图标,然后选择“资源”选项卡。如果有权访问其他资源,也可以切换资源。

适用于自定义项目的附加先决条件

除了 Azure 帐户和文档智能或 Azure AI 服务资源外,还需要:

Azure Blob 存储容器

标准性能 Azure Blob 存储帐户。 你将创建容器用于存储和组织存储帐户中的训练文档。 如果不知道如何使用容器创建 Azure 存储帐户,请按照以下快速入门中的说明操作:

  • 创建存储帐户。 创建存储帐户时,请确保在“实例详细信息”→“性能”字段中选择“标准”性能 。
  • 创建容器。 创建容器时,在“新建容器”窗口中将“公共访问级别”字段设置为“容器”(对容器和 Blob 进行匿名读取访问) 。

Azure 角色分配

对于自定义项目,不同方案需要以下角色分配。

  • 基本

    • 认知服务用户:需要在文档智能或 Azure AI 服务资源中具有此角色,来训练自定义模型或使用训练的模型进行分析。
    • 存储 Blob 数据参与者:需要在存储帐户中具有此角色,来创建项目和标记数据。
  • 高级

    • 存储帐户参与者:存储帐户需要此角色才能设置 CORS 设置(如果重复使用同一存储帐户,此操作是一次性的工作量)。
    • 参与者:需要此角色来创建资源组和资源。

    注意

    如果为文档智能服务资源和存储帐户禁用了本地(基于密钥)身份验证,请务必分别获取“认知服务用户”和“存储 Blob 数据参与者”角色,以便拥有足够的权限来使用文档智能工作室。 “存储帐户参与者”和“参与者”角色仅允许列出密钥,但在禁用密钥访问的情况下,不会向你授予使用资源的权限

配置 CORS

需要在 Azure 存储帐户上配置 CORS(跨源资源共享),以便可以从文档智能工作室进行访问。 若要在 Azure 门户中配置 CORS,需要访问存储帐户的 CORS 选项卡。

  1. 选择存储帐户的 CORS 选项卡。

    Azure 门户中 CORS 设置菜单的屏幕截图。

  2. 首先,在 Blob 服务中创建一个新的 CORS 条目。

  3. 将“允许的源”设置为“https://formrecognizer.appliedai.azure.cn”。

    显示存储帐户的 CORS 配置的屏幕截图。

    提示

    可以使用通配符“*”(而不是指定域)允许所有源域通过 CORS 发出请求。

  4. 为“允许的方法”选择所有可用的 8 个选项。

  5. 通过在每个字段中输入 * 来批准所有“允许的标头”和“公开的标头” 。

  6. 将“最长时间”设置为 120 秒或任何可接受的值。

  7. 若要保存更改,选择页面顶部的“保存”按钮。

现在,CORS 应已配置为使用文档智能工作室中的存储帐户。

示例文档集

  1. 登录到 Azure 门户,然后导航到“存储帐户”>“数据存储”>“容器”。

    Azure 门户中的数据存储菜单的屏幕截图。

  2. 从列表中选择一个容器。

  3. 从页面顶部的菜单中选择“上传”。

    Azure 门户中的容器上传按钮的屏幕截图。

  4. 此时会显示“上传 Blob”窗口。

  5. 选择要上传的文件。

    Azure 门户中的上传 Blob 窗口的屏幕截图。

注意

默认情况下,工作室将使用容器根目录下的文档。 但是,可以通过在自定义表单项目创建步骤中指定文件夹路径,来使用在文件夹中组织的数据。 请参阅在子文件夹中整理数据

后续步骤

文档智能工作室入门