可靠性建议

项目
2025-03-11

Azure 顾问可帮助确保并提高业务关键应用程序的连续性。可以在顾问仪表板的“可靠性”选项卡上获取可靠性建议。

登录到 Azure 门户。
在任意页面中搜索并选择顾问。
在顾问仪表板中，选择“可靠性”选项卡。

有关详细信息，请参阅将 Azure API 管理实例部署到多个 Azure 区域 - Azure API 管理

ResourceType：microsoft.apimanagement/service
建议 ID：2e4d65a3-1e77-4759-bcaa-13009484a97e
子类别：HighAvailability

请考虑将应用服务计划横向扩展到至少两个实例，以在日常维护期间避免冷启动延迟和服务中断。

潜在优势：优化用户体验和可用性

影响：中等

有关详细信息，请参阅在云中运行正常应用的终极指南 - Azure 应用服务

ResourceType：microsoft.web/serverfarms
建议编号：45cfc38d-3ffd-4088-bb15-e4d0e1e160fe
子类别：可伸缩性

横向扩展应用程序服务计划以避免 CPU 耗尽

CPU 利用率高可能导致应用程序出现运行时问题。应用程序在过去几天的 CPU 使用率超过了 90%。为了减少 CPU 使用率并避免运行时问题，请横向扩展应用程序。

潜在优势：使应用保持正常运行

影响：高

ResourceType：microsoft.web/sites
建议编号：1294987d-c97d-41d0-8fd8-cb6eab52d87b
子类别：可伸缩性

检查应用的服务运行状况问题

我们有一个与应用的服务运行状况相关的建议。打开 Azure 门户，转到应用，单击“诊断并解决”以查看更多详细信息。

潜在优势：使应用保持正常运行

影响：高

有关详细信息，请参阅 Azure 应用服务最佳做法 - Azure 应用服务

ResourceType：microsoft.web/sites
建议 ID：a85f5f1c-c01f-4926-84ec-700b7624af8c
子类别：其他

修复应用服务资源的备份数据库设置

当应用程序的数据库配置无效时，其备份将失败。有关详细信息，请参阅应用管理页上的应用程序备份历史记录。

潜在优势：确保业务连续性

影响：高

ResourceType：microsoft.web/sites
建议 ID：b30897cc-2c2e-4677-a2a1-107ae982ff49
子类别：灾难恢复

修复应用服务资源的备份存储设置

当应用程序的存储设置无效时，其备份将失败。有关详细信息，请参阅应用管理页上的应用程序备份历史记录。

潜在优势：确保业务连续性

影响：高

ResourceType：microsoft.web/sites
建议 ID：80efd6cb-dcee-491b-83a4-7956e9e058d5
子类别：灾难恢复

升级应用服务计划的 SKU 以避免内存问题

包含应用程序的应用服务计划超过 85% 的内存分配。内存消耗过高可能导致应用程序出现运行时问题。找到有问题的应用程序，并将其纵向扩展到具有更多内存资源的更高计划。

潜在优势：使应用保持正常运行

影响：高

ResourceType：microsoft.web/sites
建议 ID：66d3137a-c4da-4c8a-b6b8-e03f5dfba66e
子类别：可伸缩性

修复应用程序代码，一个工作进程因未处理的异常而发生故障

应用程序中的工作进程因未处理的异常而发生故障。若要确定根本原因，请在发生故障时收集内存转储和调用堆栈信息。

潜在优势：使应用保持正常运行且高度可用

影响：高

有关详细信息，请参阅 Azure 应用服务中的崩溃监视 - Azure 应用服务

ResourceType：microsoft.web/sites
建议 ID：3e35f804-52cb-4ebf-84d5-d15b3ab85dfc
子类别：其他

将应用服务升级到标准计划以避免请求拒绝

当某应用程序是共享的应用程序服务计划的一部分并多次达到其配额时，可能会拒绝传入请求。 Web 应用程序在达到配额后无法接受传入请求。若要去除配额，请升级到标准计划。

潜在优势：使应用保持正常运行

影响：高

ResourceType：microsoft.web/sites
建议 ID：78c5ab69-858a-43ca-a5ac-4ca6f9cdc30d
子类别：可伸缩性

将应用服务资源移到标准或更高层级并使用部署槽

当一周内多次部署应用程序时，可能会出现问题。你上周多次部署了应用程序。为了帮助减少对生产 Web 应用程序的部署影响，请将应用服务资源移动到标准（或更高）计划，并使用部署槽位。

潜在优势：在更新时使应用保持正常运行

影响：高

ResourceType：microsoft.web/sites
建议 ID：59a83512-d885-4f09-8e4f-c796c71c686e
子类别：其他

对应用服务资源使用部署槽

当一周内多次部署应用程序时，可能会出现问题。你在过去一周内多次部署了应用程序。为了帮助管理更改并帮助减少对生产 Web 应用程序的部署影响，请使用部署槽位。

潜在优势：在更新时使应用保持正常运行

影响：高

ResourceType：microsoft.web/sites
建议 ID：0dc165fd-69bf-468a-aa04-a69377b6feb0
子类别：其他

考虑将应用程序体系结构更改为 64 位

应用程序服务配置为 32 位，其内存消耗量接近 2 GB 的限制。如果应用程序支持，请考虑重新编译应用程序并将应用服务配置改为 64 位。

潜在优势：提高应用程序的可靠性

影响：中等

有关详细信息，请参阅应用程序性能常见问题解答 - Azure

ResourceType：microsoft.web/sites
建议编号：8be322ab-e38b-4391-a5f3-421f2270d825
子类别：可伸缩性

请考虑将此订阅中的 Static Web App(s) 托管计划升级到标准 SKU。

此订阅中所有免费 SKU Static Web Apps 使用的组合带宽超出了每月 100GB 的限制。请考虑将这些应用程序升级到标准 SKU 以避免限制。

潜在优势：通过避免限制提高应用的可用性。

影响：高

有关详细信息，请参阅定价——静态网页应用

ResourceType：microsoft.web/staticsites
建议 ID：dc3edeee-f0ab-44ae-b612-605a0a739612
子类别：可伸缩性

适用于容器的应用程序网关

迁移到支持的 AGC 版本

容器应用程序网关的版本是使用预览版预配的，不支持用于生产。务必使用最新 API 版本来预配新网关。

对于 Front Door，不建议将流量管理器用作来源之一，因为这可能会导致路由问题。如果在高可用性体系结构中需要这两个服务，请始终将流量管理器置于 Azure Front Door 前面。

潜在优势：提高工作负载复原能力。

以防止因源网络地址转换 (SNAT) 端口耗尽导致的连接失败问题，请为虚拟网络的出站流量使用 NAT 网关。 NAT 网关会动态缩放，为发往 Internet 的流量提供安全连接。

将 Microsoft Flux 扩展升级到最新主版本

Microsoft Flux 扩展有一个主要版本。规划在 6 个月内为所有已启用 Azure Arc 的 Kubernetes 和 Azure Kubernetes 服务 (AKS) 群集手动升级到 Microsoft Flux 的最新主要版本，以获取持续支持和新功能。

潜在优势：持续支持和新功能

影响：中等

有关详细信息，请参阅已启用 Azure Arc 的 Kubernetes 群集的可用扩展 - Azure Arc

ResourceType：microsoft.kubernetesconfiguration/extensions
建议 ID：4bc7a00b-edbb-4963-8800-1b0f8897fecf
子类别：ServiceUpgradeAndRetirement

Microsoft Flux 扩展即将推出的中断性变更

Microsoft Flux 扩展经常会接收到安全更新和稳定性更新。即将推出的更新与 OSS Flux 项目保持一致，将通过删除已弃用的字段来修改 HelmRelease 和 HelmChart API。为了避免工作负载中断，需要采取必要的操作。

潜在优势：更高的稳定性、安全性和新功能

影响：高

有关详细信息，请参阅已启用 Azure Arc 的 Kubernetes 群集的可用扩展 - Azure Arc

ResourceType：microsoft.kubernetesconfiguration/extensions
建议 ID：79cfad72-9b6d-4215-922d-7df77e1ea3bb
子类别：服务升级和退役

异地复制支持缓存数据的灾难恢复，即使发生罕见的广泛区域故障时也能提供有效的防护。这对于任务关键型应用程序至关重要。建议为高级 Azure Cache for Redis 实例配置被动异地复制。

潜在优势：地理复制支持缓存数据的灾难恢复。

影响：高

有关详细信息，请参阅为高级 Azure Redis 缓存实例配置被动异地复制 - Azure Redis 缓存

ResourceType：microsoft.cache/redis
建议 ID：c9e4a27c-79e6-4e4c-904f-b6612b6cd892
子类别：灾难恢复

Azure 容器应用

续订自定义域证书

你上传的自定义域证书即将过期。为了防止可能出现的服务中断，请续订证书并为容器应用上传新证书。

潜在优势：服务不会因证书过期而失败。

影响：中等

有关详细信息，请参阅 Azure 容器应用中自定义域名和证书

ResourceType：microsoft.app/containerapps
推荐ID：b9ce2d2e-554b-4391-8ebc-91c570602b04
子类别：其他

检测到阻止续订托管证书的问题。

我们已检测到容器应用使用的托管证书无法自动续订。按照文档链接确保自定义域的 DNS 设置正确。

潜在优势：避免由于证书过期而停机。

影响：高

有关详细信息，请参阅 Azure 容器应用中自定义域名和免费托管证书

ResourceType：microsoft.app/containerapps
建议 ID：fa6c0880-da2e-42fd-9cb3-e1267ec5b5c2
子类别：其他

请为您的容器化应用增加最小副本数量

为 Azure 容器应用容器化应用程序设置的最小副本计数可能太低，这可能导致复原、可伸缩性和负载均衡方面的问题。请考虑增加最低副本数量，以提高可用性。

潜在优势：提高容器应用的可用性。

影响：中等

有关详细信息，请参阅在 Azure 容器应用中缩放

ResourceType：microsoft.app/containerapps
建议 ID：9be5f344-6fa5-4abc-a1f2-61ae6192a075
子类别：HighAvailability

重新创建容器应用环境以避免 DNS 问题

容器应用环境可能存在网络问题，进而导致 DNS 问题。我们建议你创建新的容器应用环境，在新的环境中重新创建容器应用，并删除旧的容器应用环境。

你的 Azure Cosmos DB API for MongoDB 帐户符合升级到版本 4.2 的条件。升级到 v4.2 后可利用新存储格式，从而将存储成本最多降低 55%，将查询成本最多降低 45%。 v4.2 还包括许多其他功能，例如多文档事务。

潜在优势：改进了可靠性、查询/存储效率、性能和新功能

影响：中等

有关详细信息，请参阅升级 Mongo 版本 - Azure Cosmos DB for MongoDB

ResourceType：microsoft.documentdb/databaseaccounts
建议 ID：0da795d9-26d2-4f02-a019-0ec383363c88
子类别：其他

我们发现通过资源提供程序对你的帐户执行了大量控制平面操作。如果请求在连续 5 分钟内持续超过记录的限制，则可能会出现请求限流，以及 Azure Cosmos DB 资源上的操作失败或不完整。

潜在优势：优化控制平面操作，避免由于速度限制而导致操作失败

影响：中等

有关详细信息，请参阅服务配额和默认限制 - Azure Cosmos DB

资源类型：microsoft.documentdb/databaseaccounts
建议 ID：a030f8ab-4dd4-4751-822b-f231a0df5f5a
子类别：可伸缩性

Azure 数据资源管理器

解决虚拟网络问题

由于虚拟网络 (VNet) 问题，服务无法安装或继续。若要解决此问题，请执行故障排除指南中的步骤。

潜在优势：改进了可靠性、可用性、性能并提供新功能

影响：高

有关详细信息，请参阅在虚拟网络中排查 Azure 数据资源管理器群集的访问、数据摄取和运行问题 - Azure 数据资源管理器

ResourceType：microsoft.kusto/clusters
建议 ID：fa2649e9-e1a5-4d07-9b26-51c080d9a9ba
子类别：其他

为“Microsoft.Kusto/clusters”添加子网委派

如果子网没有被委派，关联的 Azure 服务将无法在其中运行。子网没有所需的委派。为“Microsoft.Kusto/clusters”委派子网。

潜在优势：改进了可靠性、可用性、性能并提供新功能

影响：高

有关详细信息，请参阅什么是 Azure 虚拟网络中的子网委派？

ResourceType：microsoft.kusto/clusters
建议 ID：f2bcadd1-713b-4acc-9810-4170a5d01dea
子类别：其他

Azure MySQL 数据库

高可用性 - 向当前没有主键的表添加一个主键。

我们的内部监视系统已发现高可用性备用服务器上存在明显的复制滞后。此滞后主要是由备用服务器在缺少主键的表上重播中继日志引起的。若要解决此问题并遵循最佳做法，建议向所有表添加主键。完成此操作后，继续禁用，然后重新启用高可用性以缓解问题。

潜在优势：通过实施此方法，备用服务器将免受由于任何表上缺少主键而导致的复制严重滞后的不利影响。此方法有助于减少故障转移时间，最终支持保持业务连续性的目标。

影响：高

有关详细信息，请参阅排查复制延迟问题 - Azure Database for MySQL 灵活服务器

ResourceType：microsoft.dbformysql/flexibleservers
建议 ID：cf388b0c-2847-4ba9-8b07-54c6b23f60fb
子类别：其他

复制 - 向当前没有主键的表添加一个主键

我们的内部监视观察到副本服务器上存在明显的复制延迟，因为副本服务器正在缺少主键的表上重播中继日志。为确保副本服务器能够有效地与主服务器同步并实时更新更改，请将主键添加到主服务器中的表，然后重新创建副本服务器。

潜在优势：通过采用此方法，副本服务器将达到与主服务器紧密同步的状态。

影响：高

有关详细信息，请参阅排查复制延迟问题 - Azure Database for MySQL 灵活服务器

ResourceType：microsoft.dbformysql/flexibleservers
建议 ID：fb41cc05-7ac3-4b0e-a773-a39b5c1ca9e4
子类别：其他

缩放副本服务器的 SKU 以匹配源服务器 SKU

副本服务器遇到复制延迟。这是因为副本服务器的SKU小于源服务器的SKU。为了确保顺利复制，我们建议扩大副本服务器的 SKU。

潜在优势：控制复制延迟。

影响：高

有关详细信息，请参阅服务层 - Azure Database for MySQL 灵活服务器

ResourceType：microsoft.dbformysql/flexibleservers
建议编号：91fd3a33-3b2f-48bb-81db-a2a54cfa2d76
子类别：可伸缩性

升级到传输层安全性 (TLS) 1.2

将应用程序的传输层安全性 (TLS) 从 TLS 1.0 或 TLS 1.1 升级到 1.2。 TLS 1.0 和 TLS 1.1 已于 2021 年 3 月弃用。

潜在优势：提高了安全性。符合最新标准。

影响：高

有关详细信息，请参阅网络概述 - Azure Database for MySQL 灵活服务器

ResourceType：microsoft.dbformysql/flexibleservers
建议 ID：f259e897-9924-45db-a1ea-788f768548da
子类别：服务升级和退役

Azure Database for PostgreSQL

删除非活动逻辑复制槽（重要）

由于预写日志 (WAL) 文件保留和快照文件的生成，非活动的逻辑复制槽可能会导致服务器性能下降和服务不可用。 Azure Database for PostgreSQL 灵活服务器可能具有非活动逻辑复制槽。这需要立即注意。删除非活动复制槽，或开始使用这些槽的更改，使槽的日志序列号 (LSN) 向前发展并接近服务器的当前 LSN。

潜在优势：通过删除非活动逻辑复制槽来提高 PostgreSQL 可用性

影响：高

有关详细信息，请参阅逻辑复制和逻辑解码 - Azure Database for PostgreSQL 灵活服务器

ResourceType：microsoft.dbforpostgresql/flexibleservers
建议 ID：33f26810-57d0-4612-85ff-a83ee9be884a
子类别：其他

配置地区冗余备份存储

配置 GRS，确保即使遇到故障或灾难，数据库也能达到其可用性和持续性目标。

潜在优势：确保从区域故障或灾难中恢复。

影响：中等

有关详细信息，请参阅备份和还原 - Azure Database for PostgreSQL 灵活服务器

ResourceType：microsoft.dbforpostgresql/flexibleservers
建议 ID：5295ed8a-f7a1-48d3-b4a9-e5e472cf1685
子类别：灾难恢复

删除非活动逻辑复制槽

当 Orcas PostgreSQL 灵活服务器具有非活动逻辑复制槽时，可能会由于预写日志 (WAL) 文件保留和快照文件的积累而导致服务器性能下降和不可用。这需要立即注意。删除非活动复制槽，或开始使用这些槽的更改，使槽的日志序列号 (LSN) 向前发展并接近服务器的当前 LSN。

潜在优势：通过删除非活动逻辑复制槽来提高 PostgreSQL 可用性

影响：高

有关详细信息，请参阅逻辑解码 - Azure Database for PostgreSQL - 单一服务器

ResourceType：microsoft.dbforpostgresql/servers
建议 ID：6f33a917-418c-4608-b34f-4ff0e7be8637
子类别：其他

Azure IoT 中心

将 Microsoft Edge 设备运行时升级到受支持的 IoT 中心版本

当 Edge 设备使用过时的版本时，可能出现性能下降。我们建议你升级到 Azure IoT Edge 运行时的最新受支持版本。

潜在优势：使用受支持的 Edge 设备最新版本以确保业务连续性

影响：中等

有关详细信息，请参阅更新设备上的 IoT Edge 版本

ResourceType：microsoft.devices/iothubs
建议 ID：51b1fad8-4838-426f-9871-107bc089677b
子类别：服务升级与退役

将设备客户端 SDK 升级到 Iot 中心的受支持版本

当设备使用过时版本的 SDK 时，可能出现性能下降。部分或所有设备正在使用过时的 SDK。我们建议你升级到受支持的 SDK 版本。

潜在优势：使用受支持的设备 SDK 来确保业务连续性

影响：中等

有关详细信息，请参阅 Azure IoT 中心设备和服务 SDK

ResourceType：microsoft.devices/iothubs
建议 ID：d448c687-b808-4143-bbdc-02c35478198a
子类别：ServiceUpgradeAndRetirement

检测到 IoT 中心潜在设备风暴

当至少两个设备尝试使用相同的设备 ID 凭据连接到 IoT 中心时，就可能发生这种情况。当第二个设备 (B) 进行连接时，会导致第一个设备 (A) 断开连接。然后 (A) 尝试再次重新连接，这会导致 (B) 断开连接。

潜在优势：改进设备的连接性

影响：中等

有关详细信息，请参阅排查 Azure IoT 中心错误代码

ResourceType：microsoft.devices/iothubs
建议 ID：8d7efd88-c891-46be-9287-0aec2fabd51c
子类别：其他

添加 IoT Hub 单位或提高 SKU 级别

当 IoT 中心超过每日消息配额时，可能出现操作和成本问题。若要确保将来的顺利运行，请添加单位或增加 SKU 级别。

潜在优势：IoT 中心可以再次接收消息。

影响：高

有关详细信息，请参阅 Azure IoT Hub 错误代码排除

ResourceType：microsoft.devices/iothubs
建议编号：e4bda6ac-032c-44e0-9b40-e0522796a6d2
子类别：可伸缩性

Azure Kubernetes 服务 (AKS)

将节点池子网大小设置为最大自动缩放设置

为了使 AKS 能够有效地横向扩展节点，请更新节点池的子网大小，以匹配自动缩放器的最大设置。

潜在优势：根据需求高效扩展。减少资源限制。

有关详细信息，请参阅配置 Azure CNI 网络以在 Azure Kubernetes 服务 (AKS) 中动态分配 IP 和增强子网支持

对具有永久性卷的群集使用 AKS 备份

Azure Kubernetes 服务 (AKS) 备份是一种云原生解决方案，用于备份和还原 AKS 群集中的容器化应用和数据。 AKS 备份支持对群集状态和永久性卷进行计划备份。 AKS 备份提供对命名空间或整个群集的精细控制。

潜在优势：群集状态和永久性卷的备份

有关详细信息，请参阅什么是 Azure Kubernetes 服务备份？

为系统节点池启用自动缩放

若要确保在高负载期间计划系统 Pod，请在系统节点池上启用自动缩放。

潜在优势：为系统节点池启用自动缩放器可确保系统 Pod 能够调度，并且群集可以正常运行。

影响：高

有关详细信息，请参阅使用 Azure Kubernetes 服务中的群集自动缩放程序（AKS） - Azure Kubernetes 服务

ResourceType：microsoft.containerservice/managedclusters
建议 ID：70829b1a-272b-4728-b418-8f1a56432d33
子类别：HighAvailability

系统节点池中至少有 2 个节点

确保系统节点池至少有 2 个节点，从而确保系统 Pod 的可靠性。如果群集中只有一个节点，则在节点或硬件出现故障时，您的群集可能会发生故障。

潜在优势：拥有 2 个节点可确保针对节点故障的复原能力。

影响：高

有关详细信息，请参阅使用 Azure Kubernetes 服务（AKS）中的系统节点池 - Azure Kubernetes 服务

ResourceType：microsoft.containerservice/managedclusters
建议 ID：a9228ae7-4386-41be-b527-acd59fad3c79
子类别：HighAvailability

创建专用系统节点池

没有专用系统节点池的群集可靠性较低。建议将系统节点池专用于为关键系统 Pod 提供服务，防止在系统 Pod 与竞争性的用户 Pod 之间造成资源饥饿现象。在池中使用 CriticalAddonsOnly=true:NoSchedule 污点强制实施此行为。

潜在优势：通过防止核心系统 Pod 的资源短缺来确保群集可靠性

影响：高

有关详细信息，请参阅使用 Azure Kubernetes 服务（AKS）中的系统节点池 - Azure Kubernetes 服务

ResourceType：microsoft.containerservice/managedclusters
建议 ID：f31832f1-7e87-499d-a52a-120f610aba98
子类别：HighAvailability

确保生产环境中不使用 B 系列虚拟机 (VM)

当群集中具有一个或多个使用不推荐的可突发 VM SKU 的节点池时，不保证可 100% 使用全部 vCPU 功能。确保 B 系列 VM 不在生产环境中使用。

潜在优势：实现一致性能的最佳做法

影响：中等

有关详细信息，请参阅 Bv1 大小系列 - Azure 虚拟机

ResourceType：microsoft.containerservice/managedclusters
建议 ID：fac2ad84-1421-4dd3-8477-9d6e605392b4
子类别：HighAvailability

Azure NetApp 文件

为 Azure Netapp 文件 AD 连接器配置 AD DS 站点

如果 Azure NetApp 文件无法访问分配的 AD DS 站点域控制器，则域控制器发现流程将查询所有域控制器。可能使用无法访问的域控制器，这可能导致在卷创建、客户端查询、身份验证和 AD 连接修改中出现问题。

潜在优势：使用 Azure Netapp 文件优化 DNS 连接

影响：高

有关详细信息，请参阅了解 Active Directory 域服务站点设计和规划指南

ResourceType：microsoft.netapp/netappaccounts
建议 ID：2e795f35-fce6-48dc-a5ac-6860cb9a0442
子类别：其他

确保分配给 Microsoft.NetApp 委派子网的角色具有子网读取权限

管理 Azure NetApp 文件资源所需的角色必须对委派给 Microsoft.NetApp 的子网具有“Microsoft.network/virtualNetworks/subnets/read”权限。如果角色（自定义或内置）没有此权限，则卷创建将失败

潜在优势：通过确保子网/读取权限来防止卷创建失败

影响：高

ResourceType：microsoft.netapp/netappaccounts/capacitypools/volumes
建议 ID：4e112555-7dc0-4f33-85e7-18398ac41345
子类别：HighAvailability

Azure Netapp 文件 - 为 SMB 卷启用连续可用性

为了实现持续可用性，我们建议为 Azure Netapp 文件启用服务器消息块 (SMB) 卷。

潜在优势：通过为 SMB 卷启用持续可用性来防止应用程序中断

影响：高

有关详细信息，请参阅对现有 Azure NetApp 文件 SMB 卷启用连续可用性

ResourceType：microsoft.netapp/netappaccounts/capacitypools/volumes
建议编号：e4bebd74-387a-4a74-b757-475d2d1b4e3e
子类别：HighAvailability

Azure Site Recovery (Azure 站点恢复)

为恢复服务保管库启用软删除

通过软删除，可在删除后将备份数据再保留在恢复服务保管库中一段时间，让你有机会在永久删除之前检索这些数据。

潜在优势：帮助在意外删除时恢复备份数据

影响：中等

有关详细信息，请参阅 Azure 备份的软删除 - Azure 备份

ResourceType：microsoft.recoveryservices/vaults
建议 ID：3ebfaf53-4d8c-4e67-a948-017bbbf59de6
子类别：灾难恢复

为恢复服务保管库启用跨区域还原

使用跨区域还原 (CRR)，可以还原位于次要区域（Azure 配对区域）的 Azure VM，帮助进行灾难恢复。

潜在优势：提高复原能力和拉取性能、简化注册表管理和降低数据传输成本

影响：高

有关详细信息，请参阅将 Azure 容器注册表异地复制到多个区域 - Azure 容器注册表

ResourceType：microsoft.containerregistry/registries
建议 ID：dcfa2602-227e-4b6c-a60d-7b1f6514e690
子类别：HighAvailability

内容分发网络

Azure CDN From Edgio，托管证书续订失败。需要其他验证。

Azure CDN from Edgio 采用 CNAME 委派通过 DigiCert 续订证书来进行托管证书续订。自定义域必须解析为 azureedge.net 终结点，通过 DigiCert 进行的自动续订过程才能成功。确保正确配置自定义域的 CNAME 和 CAA 记录。如果需要进一步帮助，请向 Azure 提交支持案例，以重新尝试续订请求。

潜在优势：确保服务可用性。

影响：高

ResourceType：microsoft.cdn/profiles
建议 ID：ceecfd41-89b3-4c64-afe6-984c9cc03126
子类别：其他

2025 年 1 月 15 日前从 Edgio 迁移出 Azure CDN

请在 2025 年 1 月 15 日之前完成从 Azure CDN Standard/Premium（由 Edgio 提供支持）的迁移，因为 Edgio 平台计划在该日期关闭。建议迁移到 Azure Front Door，以便实现兼容性。或者，请考虑使用 Azure 市场中的 Azure 流量管理器或 Akamai CDN。

潜在优势：避免停机并确保业务连续性。

影响：高

有关详细信息，请参阅 Azure 更新

ResourceType：microsoft.cdn/profiles
建议 ID：2c9e3f2a-7373-45e1-ab8b-f361e5f0c37f
子类别：服务升级和退役

数据工厂

在 Azure 数据工厂中实施 BCDR 策略获得跨区域冗余

实施 BCDR 策略可提高数据的高可用性，降低数据丢失风险

潜在优势：提高高可用性并降低数据丢失风险

影响：中等

有关详细信息，请参阅适用于 Azure 数据工厂和 Azure Synapse Analytics 管道的 BCDR - Azure 体系结构中心

资源类型：microsoft.datafactory/factories
建议 ID：617ee02c-be69-441e-8294-dee5a237efff
子类别：灾难恢复

在 SHIR 上启用自动升级

自托管集成运行时的自动升级已被禁用。知道你未在自承载集成运行时上获取最新的更改和 bug 修复。检查这些设置以启用 SHIR 自动升级

潜在优势：获取自托管集成运行时的最新的更改与错误修复

影响：中等

有关详细信息，请参阅自承载集成运行时自动更新和过期通知 - Azure 数据工厂

ResourceType：microsoft.datafactory/factories
建议 ID：939b97dc-fdca-4324-ba36-6ea7e1ab399b
子类别：null

液体继电器

应升级 Azure Fluid Relay 客户端库

如果使用旧客户端库调用了 Azure Fluid Relay 服务，则可能会导致应用程序问题。为了确保应用程序保持运行，请将 Azure Fluid Relay 客户端库升级到最新版本。升级提供了最新功能，并且增强了性能和稳定性。

未使用最新映像的群集没有最新的升级。你的群集未使用最新映像。我们建议你使用最新版本的 HDInsight 映像，以获取最好的开放源代码更新、Azure 更新和安全修补程序。新的 HDInsight 版本每 30 到 60 天发布一次。

潜在优势：获取最新的修补程序和功能

影响：高

有关详细信息，请参阅 Azure HDInsight 的发行说明

ResourceType：microsoft.hdinsight/clusters
建议 ID：97355d8e-59ae-43ff-9214-d4acf728467a
子类别：服务升级与退役

无法访问网关或虚拟机

我们检测到网络故障，这表示网关或虚拟机不可访问。验证所有群集主机的可用性。重启虚拟机以恢复。如果需要进一步的帮助，请随时联系 Azure 支持以获取帮助。

潜在优势：可靠性提高

影响：高

ResourceType：microsoft.hdinsight/clusters
建议 ID：b3bf9f14-c83e-4dd3-8f5c-a6be746be173
子类别：其他

VM 代理为 9.9.9.9。升级集群。

我们的记录表明，你的一个或多个群集正在使用日期为 2022 年 2 月或更早的映像（映像版本 2202xxxxxx 或更早）。使用 2022 年 2 月或更早版本映像的 HDInsight 群集存在潜在的可靠性问题。请考虑使用最新映像重建群集。

潜在优势：提高了缩放和网络连接的可靠性

影响：高

ResourceType：microsoft.hdinsight/clusters
建议 ID：e4635832-0ab1-48b1-a386-c791197189e6
子类别：服务升级与退役

媒体服务

增加媒体服务配额或限制

当媒体帐户达到其配额限制时，可能出现服务中断。若要避免服务中断，请查看资产当前使用情况、内容密钥策略和流策略，并增加接近达到限制的实体的配额限制。可以通过开具票证并添加相关详细信息来请求提高配额限制。提示：请不要创建更多的 Azure 媒体帐户来提高配额上限。

潜在优势：避免因客户超出配额限制而导致服务中断。

影响：中等

有关详细信息，请参阅 Azure 媒体服务中的配额和限制

ResourceType：microsoft.media/mediaservices
建议 ID：b7c9fd99-a979-40b4-ab48-b1dfab6bb41a
子类别：可伸缩性

服务总线

使用服务总线高级层提高复原能力

运行关键应用程序时，服务总线高级层在 CPU 和内存级别提供更好的资源隔离，进而增强可用性。它还支持异地灾难恢复功能，因此无需更改应用程序配置，即可更轻松地从区域灾难中恢复。

潜在优势：服务总线高级层通过 CPU 和内存资源隔离以及异地灾难恢复提供更高的弹性。

影响：低

有关详细信息，请参阅 Azure 服务总线高级消息传送层 - Azure 服务总线

ResourceType：microsoft.servicebus/namespaces
建议 ID：29765e2c-5286-4039-963f-f8231e56cc3e
子类别：HighAvailability

使用高级层中的服务总线自动缩放功能来提高复原能力

在运行关键应用程序时，启用自动缩放功能可以让你拥有足够的容量来处理应用程序的负载。运行适当的资源量可以减少限制，并提供更好的用户体验。

潜在优势：启用自动缩放可防止用户受到容量限制

影响：高

有关详细信息，请参阅 Azure 服务总线 - 自动更新消息传送单元 - Azure 服务总线

ResourceType：microsoft.servicebus/namespaces
建议 ID：68e62f5c-4ed1-4b78-a2a0-4d9a4cebf106
子类别：可伸缩性

Azure 虚拟机中的 SQL Server

为虚拟机上的 SQL 启用 Azure 备份

要实现 SQL AG 集成的零基础结构备份、时间点还原和集中管理等优势，请使用 Azure 备份为虚拟机上的 SQL 数据库启用备份。

潜在优势：没有基础结构的 SQL 感知备份，用于备份、集中管理、AG 集成和时间点还原

影响：中等

有关详细信息，请参阅将 SQL Server 数据库备份到 Azure - Azure 备份

ResourceType：microsoft.sqlvirtualmachine/sqlvirtualmachines
建议 ID：77f01e65-e57f-40ee-a0e9-e18c007d4d4c
子类别：灾难恢复

存储

在单实例虚拟机中使用高级 SSD 托管磁盘以最大程度地延长运行时间。允许从标准托管磁盘转换为高级托管磁盘。

潜在优势：增强性能、提高可配置性和延长运行时间

有关详细信息，请参阅使用 Azure 虚拟机和托管磁盘实现高可用性的最佳做法

应在虚拟网络级别配置 DNS 服务器

在虚拟网络级别设置虚拟机的 DNS 服务器，以确保整个环境的一致性。在主网络接口的配置中，DNS 服务器应设置为“从虚拟网络继承”。

潜在好处：确保一致性和可靠的名称解析

影响：低

有关详细信息，请参阅 Azure 虚拟网络中资源的名称解析

ResourceType：microsoft.compute/virtualmachines
建议 ID：490262e8-313c-431f-a143-a9c2cadba41b
子类别：其他

在虚拟机上启用备份

为虚拟机启用备份以保护数据。

潜在优势：保护虚拟机

影响：中等

有关详细信息，请参阅什么是 Azure 备份？- Azure 备份

将 Hyperspace Web 服务器部署为为 3 个区域配置的虚拟机规模集 Flex 的一部分

我们观察到，虚拟机规模集 Flex 设置中的 Hyperspace Web 服务器并未分布在所选区域的 3 个区域中。对于需要高可用性和大规模的服务，如 Epic 系统中的 Hyperspace Web，建议将服务器部署为虚拟机规模集 Flex 的一部分，并分布在 3 个区域。借助灵活业务流程，Azure 可在整个 Azure VM 生态系统中提供统一的体验

潜在优势：Hyperspace Web 服务器在 Epic DB 中可实现高可用性和按需大规模扩展

影响：中等

有关详细信息，请参阅创建使用可用性区域的 Azure 规模集 - Azure 虚拟机规模集

ResourceType：microsoft.workloads/epicvirtualinstances/hyperspacewebinstances
建议 ID：dfa50c39-104a-418b-873a-c145fe521c9b
子类别：HighAvailability

在 Citrix VDI 服务器上配置本地主机缓存以确保无缝连接代理操作

我们观察到，你的 Citrix VDI 服务器未配置本地主机缓存。本地主机缓存 (LHC) 是 Citrix 虚拟应用和桌面中的一项功能，允许连接代理操作在发生中断时继续。当站点数据库在 90 秒内无法访问时，LHC 就会参与。

潜在优势：无缝连接代理操作

影响：中等

ResourceType：microsoft.workloads/epicvirtualinstances/presentationinstances
建议 ID：f3d23f88-aee2-4b5a-bfd6-65b22bd70fc0
子类别：HighAvailability

为多用途 SQL 服务器 (MPSQL) 配置 Always On 可用性组

具有 Always On 可用性组的 MPSQL 服务器具有更好的可用性。你的 MPSQL 服务器未配置为 Epic 系统中共享基础结构中 AlwaysOn 可用性组的一部分。 Always On 可用性组可提高数据库的可用性并改进资源使用情况。

潜在优势：改进了数据库可用性和资源使用

影响：中等

有关详细信息，请参阅什么是 AlwaysOn 可用性组？- SQL Server Always On

ResourceType：microsoft.workloads/epicvirtualinstances/sharedinstances
推荐ID：3ca22452-0f8f-4701-a313-a2d83334e3cc
子类别：HighAvailability

通过

可靠性建议

AgFood 平台

升级到最新的 ADMA DotNet SDK 版本

升级到最新的 FarmBeats API 版本

升级到最新的 ADMA Python SDK 版本

升级到最新的 ADMA JavaScript SDK 版本

API 管理

将API 管理服务迁移到 stv2 平台

主机名证书轮换失败

旧门户已在 3 年前被弃用，于 2023 年 10 月停用。 但我们看到该门户的使用非常活跃，当我们禁用它后，可能会导致服务中断。

依赖项网络状态检查失败

SSL/TLS 重新协商受阻

将 Azure API Management 实例部署到多个 Azure 区域以享更高的服务可用性

在生产工作负载上为 API 管理实例启用和配置自动缩放。

应用服务证书

颁发应用程序服务证书需要域验证

应用程序服务

验证应用服务域的联系信息

横向扩展应用服务计划

横向扩展应用程序服务计划以避免 CPU 耗尽

检查应用的服务运行状况问题

修复应用服务资源的备份数据库设置

修复应用服务资源的备份存储设置

升级应用服务计划的 SKU 以避免内存问题

修复应用程序代码，一个工作进程因未处理的异常而发生故障

将应用服务升级到标准计划以避免请求拒绝

将应用服务资源移到标准或更高层级并使用部署槽

对应用服务资源使用部署槽

考虑将应用程序体系结构更改为 64 位

请考虑将此订阅中的 Static Web App(s) 托管计划升级到标准 SKU。

适用于容器的应用程序网关

迁移到支持的 AGC 版本

应用程序网关

升级你的 SKU 或添加更多实例

避免替代主机名以确保站点的完整性

更改 V1 网关的子网，因为当前子网包含 NAT 网关

跨可用性区域部署应用程序网关

更新应用程序网关用户的 VNet 权限

确保自动缩放用于提高性能和复原能力

更改名为 GatewaySubnet 的 V1 网关子网，因为它已保留用于 VPN/Express 路由

重新激活订阅以解除对 V1 网关内部升级的限制

使用托管 TLS 证书

考虑至少有两个原点

在 Front Door 和原点上使用同一域名

避免将流量管理器放在 Front Door 后面

解决专用终结点未处于成功状态的问题

向配置文件再添加至少一个终结点（首选在另一 Azure 区域进行）

将配置的终结点添加到“所有(全球)”

将一个终结点添加或移动到另一个 Azure 区域

ExpressRoute IP 路由接近指定的限制

在虚拟网络中实现多个 ExpressRoute 线路以确保跨地点高可用性

从基本网关移到生产网关 SKU

启用主动-主动网关以确保冗余

为 ExpressRoute 实现站点复原

实现区域冗余 ExpressRoute 网关

使用用于出站连接的 NAT 网关

Azure AI 搜索

创建标准搜索服务 (2GB)

创建标准搜索服务 (50MB)

通过添加更多分区，来避免超出可用存储配额

升级到最新版本的 listQueryKeys 请求

为 Azure AI 搜索实例添加副本

已启用 Azure Arc 的 Kubernetes 配置

将 Microsoft Flux 扩展升级到最新主版本

Microsoft Flux 扩展即将推出的中断性变更

将 Microsoft Flux 扩展升级到支持的版本

已启用 Azure Arc 的 Kubernetes

升级到已启用 Azure Arc 的 Kubernetes 最新代理版本

已启用 Azure Arc 的服务器

升级到最新版的 Azure Connected Machine Agent

用于 Redis 的 Azure 缓存

增加碎片内存预留

为 Cache for Redis 实例配置异地复制以提高应用程序的持久性

Azure 容器应用

续订自定义域证书

检测到阻止续订托管证书的问题。

请为您的容器化应用增加最小副本数量

重新创建容器应用环境以避免 DNS 问题

Azure Cosmos DB

旧门户已在 3 年前被弃用，于 2023 年 10 月停用。但我们看到该门户的使用非常活跃，当我们禁用它后，可能会导致服务中断。

Azure CDN From Edgio，托管证书续订失败。需要其他验证。