解决 VMware VM 和物理服务器的复制问题
本文介绍在使用 Site Recovery 将本地 VMware VM 和物理服务器复制到 Azure 时可能遇到的一些常见问题和具体错误。
步骤 1:监视进程服务器运行状况
Site Recovery 使用进程服务器接收和优化复制的数据,并将其发送到 Azure。
建议在门户中监视进程服务器的运行状况,以确保它们已连接并正常运行,且正在对进程服务器关联的源计算机进行复制。
- 了解如何监视进程服务器。
- [查看最佳做法]。(vmware-physical-azure-troubleshoot-process-server.md#best-practices-for-process-server-deployment)
- 排查进程服务器运行状况问题。
步骤 2:排查连接和复制问题
源服务器与进程服务器或者进程服务器与 Azure 之间的连接问题通常会造成初始和进行中的复制失败。
若要解决这些问题,请排查连接和复制问题。
步骤 3:排查不可用于复制的源计算机的问题
尝试选择源计算机来通过 Site Recovery 启用复制时,计算机可能由于以下原因之一而不可用:
- 具有相同实例 UUID 的两个虚拟机:如果 vCenter 中存在具有相同实例 UUID 的两个虚拟机,则配置服务器发现的第一个虚拟机将显示在 Azure 门户中。 若要解决此问题,请确保没有两个虚拟机具有相同的实例 UUID。 如果备份 VM 处于活动状态,并且已记录到发现记录,则这种情况会很常见。 请参阅使用 Azure Site Recovery 进行 VMware 到 Azure 的复制:如何清理重复或过时的条目来解决问题。
- vCenter 用户凭据不正确:确保在使用 OVF 模板或统一安装程序安装配置服务器时添加正确的 vCenter 凭据。 若要验证安装期间添加的凭据是否正确,请参阅修改用于自动发现的凭据。
- vCenter 特权不足:如果未提供所需的权限来访问 vCenter,则发现虚拟机时可能会失败。 确保将为自动发现准备帐户中所述的权限添加到 vCenter 用户帐户。
- Azure Site Recovery 管理服务器:如果虚拟机用作管理服务器并充当以下一个或多个角色 - 配置服务器/横向扩展进程服务器/主目标服务器,则无法在门户中选择该虚拟机。 无法复制管理服务器。
- 已通过 Azure Site Recovery 服务进行保护/故障转移:如果虚拟机已通过 Site Recovery 进行保护或故障转移,则无法在门户中选择保护该虚拟机。 确保要在门户中查找的虚拟机尚未由其他任何用户进行保护,或者位于不同的订阅下。
- vCenter 未连接:检查 vCenter 是否处于已连接状态。 若要验证,请转到“恢复服务保管库”>“Site Recovery 基础结构”>“配置服务器”> 单击相应的配置服务器 > 右侧会打开一个边栏选项卡,其中显示了关联服务器的详细信息。 检查 vCenter 是否已连接。 如果其处于“未连接”状态,请解决问题,并在门户中刷新配置服务器。 在此之后,虚拟机不会在门户中列出。
- ESXi 已关机:如果虚拟机所在的 ESXi 主机处于关机状态,则虚拟机将不会列出,或者在 Azure 门户中不可选择。 打开 ESXi 主机,并在门户中刷新配置服务器。 在此之后,虚拟机将在门户中列出。
- 等待重新启动:如果虚拟机正在等待重新启动,则你无法在 Azure 门户中选择该虚拟机。 请务必完成等待中的重新启动活动,并刷新配置服务器。 在此之后,虚拟机将在门户中列出。
- 未找到 IP 或计算机没有 IP 地址:如果虚拟机没有关联有效的 IP 地址,则无法在 Azure 门户中选择该虚拟机。 请务必将有效的 IP 地址分配到虚拟机,并刷新配置服务器。 如果计算机没有有效 IP 地址与其 NIC 之一关联,则可能会导致此错误。 为所有 NIC 分配一个有效的 IP 地址或删除缺少 IP 的 NIC。 然后,虚拟机列在门户中。
排查门户中处于灰显状态的受保护虚拟机的问题
如果系统中存在重复的条目,则在 Site Recovery 下复制的虚拟机将不会显示在 Azure 门户中。 详细了解如何删除过时的条目并解决问题。
另一个原因是计算机已克隆。 当计算机在虚拟机监控程序之间移动时,如果 BIOS ID 发生更改,则移动代理会阻止复制。 Site Recovery 不支持复制克隆的计算机。
在过去“XXX”分钟内没有可供 VM 使用的崩溃一致性恢复点
以下是一些最常见问题的列表:
初始复制问题 [错误 78169]
反复确认不存在连接、带宽或时间同步相关的问题后,请确保:
- 没有任何防病毒软件正在阻止 Azure Site Recovery。 详细了解 Azure Site Recovery 要求排除的文件夹。
源计算机改动率高 [错误 78188]
可能的原因:
- 虚拟机列出的磁盘上的数据更改率(写入字节数/秒)大于复制目标存储帐户类型的 Azure Site Recovery 支持限制。
- 由于大量数据正在等待上传,导致变动率激增。
若要解决此问题:
确保根据源中的改动率要求预配目标存储帐户类型(标准或高级)。
如果已复制到高级托管磁盘(asrseeddisk 类型),请确保磁盘大小支持根据 Site Recovery 限制观察到的改动率。 如果需要,可以增加 asrseeddisk 的大小。 执行以下步骤:
- 导航到受影响的复制计算机的“磁盘”边栏选项卡,并复制副本磁盘名称
- 导航到此副本托管磁盘
- 可能会在“概述”边栏选项卡上看到一个横幅,指出已生成 SAS URL。 单击此横幅并取消导出。 如果看不到横幅,请忽略此步骤。
- 撤销 SAS URL 后,请转至托管磁盘的“配置”边栏选项卡并增加大小,以便 Azure Site Recovery 支持源磁盘上观察到的变动率。
如果观测到的变动率是暂时性的,请等待几个小时,让等待中的数据跟上上传进度并创建恢复点。
如果磁盘包含非关键数据(如临时日志、测试数据等),请考虑将此数据移到其他位置,或者从复制中完全排除此磁盘
如果问题持续出现,请使用 Site Recovery 部署规划器来帮助规划复制。
源计算机无检测信号 [错误 78174]
如果源计算机上的 Azure Site Recovery 移动代理与配置服务器 (CS) 通信,则会发生此错误。
若要解决此问题,请使用以下步骤来验证源 VM 与配置服务器之间的网络连接:
验证源计算机是否正在运行。
使用具有管理员特权的帐户登录到源计算机。
验证以下服务是否正在运行,如果未运行,请重启以下服务:
- Svagents (InMage Scout VX Agent)
- InMage Scout 应用程序服务
在源计算机上,检查位于以下位置的日志以查看错误详细信息:
C:\Program Files (X86)\21Vianet Azure Site Recovery\agent\svagents*.log
进程服务器无检测信号 [错误 806]
如果进程服务器未发出检测信号,请检查:
进程服务器 VM 是否已启动并运行
查看进程服务器上的以下日志以查看错误详细信息:
C:\ProgramData\ASR\home\svsystems\eventmanager*.log
和
C:\ProgramData\ASR\home\svsystems\monitor_protection*.log
主目标服务器无检测信号 [错误 78022]
如果主目标上的 Azure Site Recovery 移动代理与配置服务器不通信,则会发生此错误。
若要解决此问题,请使用以下步骤验证服务状态:
验证主目标 VM 是否正在运行。
使用具有管理员特权的帐户登录到主目标 VM。
验证 svagents 服务是否正在运行。 如果正在运行,请重启服务
检查位于以下位置的日志以查看错误详细信息:
C:\Program Files (X86)\21Vianet Azure Site Recovery\agent\svagents*.log
若要将主目标注册到配置服务器,请导航到文件夹 %PROGRAMDATA%\ASR\Agent,并在命令提示符中运行以下命令:
cmd cdpcli.exe --registermt net stop obengine net start obengine exit
无法成功为虚拟机启用保护 [错误 78253]
如果复制策略未与配置服务器正确关联,则可能会发生此错误。 如果与配置服务器关联的策略无效,则也可能发生这种情况。
若要确认此错误的原因,请导航到恢复保管库 > 管理 Site Recovery 基础结构,然后查看 VMware 和物理计算机的复制策略,以检查配置的策略的状态。
若要解决此问题,可以将策略与正在使用的配置服务器相关联,或者创建新的复制策略并将其关联。 如果策略无效,可以取消关联并将其删除。
错误 ID 78144 - 在过去“XXX”分钟内没有可供 VM 使用的应用一致性恢复点
移动代理 9.23 和 9.27 版本已进行增强,以处理 VSS 安装失败行为。 请确保使用的是最新版本,以获取有关排查 VSS 故障的最佳指南。
下面列出了其中的一些最常见问题:
原因 1:SQL Server 2008/2008 R2 中的已知问题
如何修复:SQL Server 2008/2008 R2 有一个已知问题。 请参阅此知识库文章:托管 SQL Server 2008 R2 的服务器的 Azure Site Recovery 代理或其他非组件 VSS 备份失败
原因 2:在使用 AUTO_CLOSE DB 托管任何版本的 SQL Server 实例的服务器上,Azure Site Recovery 作业失败
如何修复:请参阅知识库文章
如何修复:请参阅知识库文章
原因 3:SQL Server 2016 和 2017 中的已知问题
如何修复:请参阅知识库文章
原因 4:Linux 服务器上未启用应用一致性
如何修复:适用于 Linux 操作系统的 Azure Site Recovery 支持通过应用程序自定义脚本实现应用一致性。 为保障应用一致性,Azure Site Recovery 移动代理将使用带有 pre 和 post 选项的自定义脚本。 这里是启用此功能的步骤。
VSS 相关问题的更多原因:
若要进一步排除故障,请检查源计算机上的文件,获取故障的具体错误代码:
C:\Program Files (x86)\21Vianet Azure Site Recovery\agent\Application Data\ApplicationPolicyLogs\vacp.log
如何在文件中查找错误? 通过在编辑器中打开 vacp.log 文件来搜索字符串“vacpError”
Ex:
vacpError
:220#Following disks are in FilteringStopped state [\\.\PHYSICALDRIVE1=5, ]#220|^|224#FAILED: CheckWriterStatus().#2147754994|^|226#FAILED to revoke tags.FAILED: CheckWriterStatus().#2147754994|^|
在前述示例中,“2147754994”是介绍故障情况的错误代码,如下所示:
VSS 编写器未安装 - 错误 2147221164
如何修复:为了生成应用程序一致性标记,Azure Site Recovery 会使用 Azure 卷影复制服务 (VSS)。 它安装适用于其操作的 VSS 提供程序,以便拍摄应用一致性快照。 此 VSS 提供程序作为服务安装。 如果 VSS 提供程序服务未安装,则应用程序一致性快照创建会失败,并出现 ID 为 0x80040154 的错误“类未注册”。
VSS 编写器已禁用 - 错误 2147943458
如何修复:为了生成应用程序一致性标记,Azure Site Recovery 会使用 Azure 卷影复制服务 (VSS)。 它安装适用于其操作的 VSS 提供程序,以便拍摄应用一致性快照。 此 VSS 提供程序作为服务安装。 如果 VSS 提供程序服务已禁用,则应用程序一致性快照创建会失败,并出现错误“指定的服务已禁用,无法启动(0x80070422)”。
- 如果已禁用 VSS:
- 确认 VSS 提供程序服务的启动类型是否设置为“自动”。
- 重启以下服务:
- VSS 服务
- Azure Site Recovery VSS 提供程序
- VDS 服务
VSS PROVIDER NOT_REGISTERED - 错误 2147754756
如何修复:为了生成应用程序一致性标记,Azure Site Recovery 会使用 Azure 卷影复制服务 (VSS)。
检查 Azure Site Recovery VSS 提供程序服务是否已安装。
- 使用以下命令重试提供程序安装:
- 卸载现有提供程序:C:\Program Files (x86)\21Vianet Azure Site Recovery\agent\InMageVSSProvider_Uninstall.cmd
- 重新安装:C:\Program Files (x86)\21Vianet Azure Site Recovery\agent\InMageVSSProvider_Install.cmd
确认 VSS 提供程序服务的启动类型是否设置为“自动”。 - 重启以下服务:- VSS 服务 - Azure Site Recovery VSS 提供程序 - VDS 服务
错误 ID 95001 - 发现权限不足
尝试启用复制时,如果应用程序文件夹没有足够的权限,则会出现此错误。
如何修复:若要解决此问题,请确保 IUSR 用户拥有对以下所有文件夹的所有者角色:
- C\ProgramData\Azure Site Recovery\private
- 安装目录。 例如,如果安装目录为 F 驱动器,则提供对以下项的相应权限:
- F:\Program Files (x86)\21Vianet Azure Site Recovery\home\svsystems
- 安装目录中的“\pushinstallsvc”文件夹。 例如,如果安装目录为 F 驱动器,则提供对以下项的相应权限:
- F:\Program Files (x86)\21Vianet Azure Site Recovery\home\svsystems\pushinstallsvc
- 安装目录中的“\etc”文件夹。 例如,如果安装目录为 F 驱动器,则提供对以下项的相应权限:
- F:\Program Files (x86)\21Vianet Azure Site Recovery\home\svsystems\etc
- C:\Temp
- C:\thirdparty\php5nts
- 以下路径下的所有项:
- C:\thirdparty\rrdtool-1.2.15-win32-perl58\rrdtool\Release*
排查和处理复制服务器上的时间更改
如果源计算机的时间向将来推移,然后在短时间内向过去推移以更正更改,就会发生此错误。 你可能不会注意到此更改,因为时间会很快得到更正。
如何解决:要解决此问题,请等到系统时间超过偏移的未来时间。 另一种选项是再次禁用和启用复制,这仅适用于正向复制(数据从本地复制到 Azure),而不适用于反向复制(数据从 Azure 复制到本地)。
后续步骤
如需更多帮助,请在有关 Azure Site Recovery 的 Microsoft Q&A 问题页面中发布问题。 我们的社区非常活跃,将有一位工程师为你提供帮助。