解决 VMware VM 和物理服务器的复制问题

本文介绍在使用 Site Recovery 将本地 VMware VM 和物理服务器复制到 Azure 时可能遇到的一些常见问题和具体错误。

步骤 1:监视进程服务器运行状况

Site Recovery 使用进程服务器接收和优化复制的数据,并将其发送到 Azure。

建议在门户中监视进程服务器的运行状况,以确保它们已连接并正常运行,且正在对进程服务器关联的源计算机进行复制。

  • 了解如何监视进程服务器。
  • [查看最佳做法]。(vmware-physical-azure-troubleshoot-process-server.md#best-practices-for-process-server-deployment)
  • 排查进程服务器运行状况问题。

步骤 2:排查连接和复制问题

源服务器与进程服务器或者进程服务器与 Azure 之间的连接问题通常会造成初始和进行中的复制失败。

若要解决这些问题,请排查连接和复制问题

步骤 3:排查不可用于复制的源计算机的问题

尝试选择源计算机来通过 Site Recovery 启用复制时,计算机可能由于以下原因之一而不可用:

  • 具有相同实例 UUID 的两个虚拟机:如果 vCenter 中存在具有相同实例 UUID 的两个虚拟机,则配置服务器发现的第一个虚拟机将显示在 Azure 门户中。 若要解决此问题,请确保没有两个虚拟机具有相同的实例 UUID。 如果备份 VM 处于活动状态,并且已记录到发现记录,则这种情况会很常见。 请参阅使用 Azure Site Recovery 进行 VMware 到 Azure 的复制:如何清理重复或过时的条目来解决问题。
  • vCenter 用户凭据不正确:确保在使用 OVF 模板或统一安装程序安装配置服务器时添加正确的 vCenter 凭据。 若要验证安装期间添加的凭据是否正确,请参阅修改用于自动发现的凭据
  • vCenter 特权不足:如果未提供所需的权限来访问 vCenter,则发现虚拟机时可能会失败。 确保将为自动发现准备帐户中所述的权限添加到 vCenter 用户帐户。
  • Azure Site Recovery 管理服务器:如果虚拟机用作管理服务器并充当以下一个或多个角色 - 配置服务器/横向扩展进程服务器/主目标服务器,则无法在门户中选择该虚拟机。 无法复制管理服务器。
  • 已通过 Azure Site Recovery 服务进行保护/故障转移:如果虚拟机已通过 Site Recovery 进行保护或故障转移,则无法在门户中选择保护该虚拟机。 确保要在门户中查找的虚拟机尚未由其他任何用户进行保护,或者位于不同的订阅下。
  • vCenter 未连接:检查 vCenter 是否处于已连接状态。 若要验证,请转到“恢复服务保管库”>“Site Recovery 基础结构”>“配置服务器”> 单击相应的配置服务器 > 右侧会打开一个边栏选项卡,其中显示了关联服务器的详细信息。 检查 vCenter 是否已连接。 如果其处于“未连接”状态,请解决问题,并在门户中刷新配置服务器。 在此之后,虚拟机不会在门户中列出。
  • ESXi 已关机:如果虚拟机所在的 ESXi 主机处于关机状态,则虚拟机将不会列出,或者在 Azure 门户中不可选择。 打开 ESXi 主机,并在门户中刷新配置服务器。 在此之后,虚拟机将在门户中列出。
  • 等待重新启动:如果虚拟机正在等待重新启动,则你无法在 Azure 门户中选择该虚拟机。 请务必完成等待中的重新启动活动,并刷新配置服务器。 在此之后,虚拟机将在门户中列出。
  • 未找到 IP 或计算机没有 IP 地址:如果虚拟机没有关联有效的 IP 地址,则无法在 Azure 门户中选择该虚拟机。 请务必将有效的 IP 地址分配到虚拟机,并刷新配置服务器。 如果计算机没有有效 IP 地址与其 NIC 之一关联,则可能会导致此错误。 为所有 NIC 分配一个有效的 IP 地址或删除缺少 IP 的 NIC。 然后,虚拟机列在门户中。

排查门户中处于灰显状态的受保护虚拟机的问题

如果系统中存在重复的条目,则在 Site Recovery 下复制的虚拟机将不会显示在 Azure 门户中。 详细了解如何删除过时的条目并解决问题。

另一个原因是计算机已克隆。 当计算机在虚拟机监控程序之间移动时,如果 BIOS ID 发生更改,则移动代理会阻止复制。 Site Recovery 不支持复制克隆的计算机。

在过去“XXX”分钟内没有可供 VM 使用的崩溃一致性恢复点

以下是一些最常见问题的列表:

初始复制问题 [错误 78169]

反复确认不存在连接、带宽或时间同步相关的问题后,请确保:

  • 没有任何防病毒软件正在阻止 Azure Site Recovery。 详细了解 Azure Site Recovery 要求排除的文件夹。

源计算机改动率高 [错误 78188]

可能的原因:

  • 虚拟机列出的磁盘上的数据更改率(写入字节数/秒)大于复制目标存储帐户类型的 Azure Site Recovery 支持限制
  • 由于大量数据正在等待上传,导致变动率激增。

若要解决此问题:

  • 确保根据源中的改动率要求预配目标存储帐户类型(标准或高级)。

  • 如果已复制到高级托管磁盘(asrseeddisk 类型),请确保磁盘大小支持根据 Site Recovery 限制观察到的改动率。 如果需要,可以增加 asrseeddisk 的大小。 执行以下步骤:

    • 导航到受影响的复制计算机的“磁盘”边栏选项卡,并复制副本磁盘名称
    • 导航到此副本托管磁盘
    • 可能会在“概述”边栏选项卡上看到一个横幅,指出已生成 SAS URL。 单击此横幅并取消导出。 如果看不到横幅,请忽略此步骤。
    • 撤销 SAS URL 后,请转至托管磁盘的“配置”边栏选项卡并增加大小,以便 Azure Site Recovery 支持源磁盘上观察到的变动率。
  • 如果观测到的变动率是暂时性的,请等待几个小时,让等待中的数据跟上上传进度并创建恢复点。

  • 如果磁盘包含非关键数据(如临时日志、测试数据等),请考虑将此数据移到其他位置,或者从复制中完全排除此磁盘

  • 如果问题持续出现,请使用 Site Recovery 部署规划器来帮助规划复制。

源计算机无检测信号 [错误 78174]

如果源计算机上的 Azure Site Recovery 移动代理与配置服务器 (CS) 通信,则会发生此错误。

若要解决此问题,请使用以下步骤来验证源 VM 与配置服务器之间的网络连接:

  1. 验证源计算机是否正在运行。

  2. 使用具有管理员特权的帐户登录到源计算机。

  3. 验证以下服务是否正在运行,如果未运行,请重启以下服务:

    • Svagents (InMage Scout VX Agent)
    • InMage Scout 应用程序服务
  4. 在源计算机上,检查位于以下位置的日志以查看错误详细信息:

    C:\Program Files (X86)\21Vianet Azure Site Recovery\agent\svagents*.log

进程服务器无检测信号 [错误 806]

如果进程服务器未发出检测信号,请检查:

  1. 进程服务器 VM 是否已启动并运行

  2. 查看进程服务器上的以下日志以查看错误详细信息:

    C:\ProgramData\ASR\home\svsystems\eventmanager*.log

    C:\ProgramData\ASR\home\svsystems\monitor_protection*.log

主目标服务器无检测信号 [错误 78022]

如果主目标上的 Azure Site Recovery 移动代理与配置服务器不通信,则会发生此错误。

若要解决此问题,请使用以下步骤验证服务状态:

  1. 验证主目标 VM 是否正在运行。

  2. 使用具有管理员特权的帐户登录到主目标 VM。

    • 验证 svagents 服务是否正在运行。 如果正在运行,请重启服务

    • 检查位于以下位置的日志以查看错误详细信息:

      C:\Program Files (X86)\21Vianet Azure Site Recovery\agent\svagents*.log

  3. 若要将主目标注册到配置服务器,请导航到文件夹 %PROGRAMDATA%\ASR\Agent,并在命令提示符中运行以下命令:

    cmd
    cdpcli.exe --registermt
    
    net stop obengine
    
    net start obengine
    
    exit
    

无法成功为虚拟机启用保护 [错误 78253]

如果复制策略未与配置服务器正确关联,则可能会发生此错误。 如果与配置服务器关联的策略无效,则也可能发生这种情况。

若要确认此错误的原因,请导航到恢复保管库 > 管理 Site Recovery 基础结构,然后查看 VMware 和物理计算机的复制策略,以检查配置的策略的状态。

若要解决此问题,可以将策略与正在使用的配置服务器相关联,或者创建新的复制策略并将其关联。 如果策略无效,可以取消关联并将其删除。

错误 ID 78144 - 在过去“XXX”分钟内没有可供 VM 使用的应用一致性恢复点

移动代理 9.239.27 版本已进行增强,以处理 VSS 安装失败行为。 请确保使用的是最新版本,以获取有关排查 VSS 故障的最佳指南。

下面列出了其中的一些最常见问题:

原因 1:SQL Server 2008/2008 R2 中的已知问题

如何修复:SQL Server 2008/2008 R2 有一个已知问题。 请参阅此知识库文章:托管 SQL Server 2008 R2 的服务器的 Azure Site Recovery 代理或其他非组件 VSS 备份失败

原因 2:在使用 AUTO_CLOSE DB 托管任何版本的 SQL Server 实例的服务器上,Azure Site Recovery 作业失败

如何修复:请参阅知识库文章

如何修复:请参阅知识库文章

原因 3:SQL Server 2016 和 2017 中的已知问题

如何修复:请参阅知识库文章

原因 4:Linux 服务器上未启用应用一致性

如何修复:适用于 Linux 操作系统的 Azure Site Recovery 支持通过应用程序自定义脚本实现应用一致性。 为保障应用一致性,Azure Site Recovery 移动代理将使用带有 pre 和 post 选项的自定义脚本。 这里是启用此功能的步骤。

若要进一步排除故障,请检查源计算机上的文件,获取故障的具体错误代码:

C:\Program Files (x86)\21Vianet Azure Site Recovery\agent\Application Data\ApplicationPolicyLogs\vacp.log

如何在文件中查找错误? 通过在编辑器中打开 vacp.log 文件来搜索字符串“vacpError”

Ex: vacpError:220#Following disks are in FilteringStopped state [\\.\PHYSICALDRIVE1=5, ]#220|^|224#FAILED: CheckWriterStatus().#2147754994|^|226#FAILED to revoke tags.FAILED: CheckWriterStatus().#2147754994|^|

在前述示例中,“2147754994”是介绍故障情况的错误代码,如下所示

VSS 编写器未安装 - 错误 2147221164

如何修复:为了生成应用程序一致性标记,Azure Site Recovery 会使用 Azure 卷影复制服务 (VSS)。 它安装适用于其操作的 VSS 提供程序,以便拍摄应用一致性快照。 此 VSS 提供程序作为服务安装。 如果 VSS 提供程序服务未安装,则应用程序一致性快照创建会失败,并出现 ID 为 0x80040154 的错误“类未注册”。

请参阅有关 VSS 编写器安装故障排除的文章

VSS 编写器已禁用 - 错误 2147943458

如何修复:为了生成应用程序一致性标记,Azure Site Recovery 会使用 Azure 卷影复制服务 (VSS)。 它安装适用于其操作的 VSS 提供程序,以便拍摄应用一致性快照。 此 VSS 提供程序作为服务安装。 如果 VSS 提供程序服务已禁用,则应用程序一致性快照创建会失败,并出现错误“指定的服务已禁用,无法启动(0x80070422)”。

  • 如果已禁用 VSS:
    • 确认 VSS 提供程序服务的启动类型是否设置为“自动”。
    • 重启以下服务:
      • VSS 服务
      • Azure Site Recovery VSS 提供程序
      • VDS 服务

VSS PROVIDER NOT_REGISTERED - 错误 2147754756

如何修复:为了生成应用程序一致性标记,Azure Site Recovery 会使用 Azure 卷影复制服务 (VSS)。 检查 Azure Site Recovery VSS 提供程序服务是否已安装。

  • 使用以下命令重试提供程序安装:
  • 卸载现有提供程序:C:\Program Files (x86)\21Vianet Azure Site Recovery\agent\InMageVSSProvider_Uninstall.cmd
  • 重新安装:C:\Program Files (x86)\21Vianet Azure Site Recovery\agent\InMageVSSProvider_Install.cmd

确认 VSS 提供程序服务的启动类型是否设置为“自动”。 - 重启以下服务:- VSS 服务 - Azure Site Recovery VSS 提供程序 - VDS 服务

错误 ID 95001 - 发现权限不足

尝试启用复制时,如果应用程序文件夹没有足够的权限,则会出现此错误。

如何修复:若要解决此问题,请确保 IUSR 用户拥有对以下所有文件夹的所有者角色:

  • C\ProgramData\Azure Site Recovery\private
  • 安装目录。 例如,如果安装目录为 F 驱动器,则提供对以下项的相应权限:
    • F:\Program Files (x86)\21Vianet Azure Site Recovery\home\svsystems
  • 安装目录中的“\pushinstallsvc”文件夹。 例如,如果安装目录为 F 驱动器,则提供对以下项的相应权限:
    • F:\Program Files (x86)\21Vianet Azure Site Recovery\home\svsystems\pushinstallsvc
  • 安装目录中的“\etc”文件夹。 例如,如果安装目录为 F 驱动器,则提供对以下项的相应权限:
    • F:\Program Files (x86)\21Vianet Azure Site Recovery\home\svsystems\etc
  • C:\Temp
  • C:\thirdparty\php5nts
  • 以下路径下的所有项:
    • C:\thirdparty\rrdtool-1.2.15-win32-perl58\rrdtool\Release*

排查和处理复制服务器上的时间更改

如果源计算机的时间向将来推移,然后在短时间内向过去推移以更正更改,就会发生此错误。 你可能不会注意到此更改,因为时间会很快得到更正。

如何解决:要解决此问题,请等到系统时间超过偏移的未来时间。 另一种选项是再次禁用和启用复制,这仅适用于正向复制(数据从本地复制到 Azure),而不适用于反向复制(数据从 Azure 复制到本地)。

后续步骤

如需更多帮助,请在有关 Azure Site Recovery 的 Microsoft Q&A 问题页面中发布问题。 我们的社区非常活跃,将有一位工程师为你提供帮助。