如何管理分层的文件

本文为遇到与管理分层文件相关问题的用户提供指导。 有关云分层的概念性问题,请参阅 Azure 文件存储常见问题解答

如何检查是否在对文件进行分层

每小时评估一次是否需要按设置的策略对文件进行分层。 创建新服务器终结点时,可能会遇到两种情况:

  1. 首次添加新服务器终结点时,文件通常存在于该服务器位置。 需要先上传它们,然后才能开始云分层。 在完成所有文件的初始上传之前,卷可用空间策略不会开始发挥作用。 但是,一旦文件已上传,可选日期策略便会立即开始基于单独文件发挥作用。 一小时间隔也适用于此处。

  2. 添加新服务器终结点时,你可能会将空服务器位置连接到包含数据的 Azure 文件共享。 如果选择在初次下载到服务器的过程中下载命名空间并召回内容,则在命名空间降临后,会根据上次修改时间戳召回文件,直到达到卷可用空间策略和可选日期策略限制。

有多种查看文件是否已被分层到 Azure 文件共享的方法:

  • 查看文件上的文件属性。 右键单击文件,转到“详细信息”,再向下滚动到“属性”属性。 分层的文件具有以下属性集:

    属性字母 属性 定义
    A 存档 指示备份软件应备份此文件。 无论文件被分层还是完全存储在磁盘上,始终都会设置此属性。
    P 稀疏文件 指示该文件为稀疏文件。 稀疏文件是 NTFS 提供的专用化文件类型,用于在占用空间流上的文件几乎为空时提高使用效率。 Azure 文件同步将使用稀疏文件,因为文件会被完全分层或部分召回。 在完全分层文件中,文件流存储在云中。 在部分召回的文件中,文件的一部分已在磁盘上。 应用程序(例如,多媒体播放器或压缩工具)对文件进行了部分读取时可能会发生此情况。 如果文件被完全召回到磁盘,Azure 文件同步会将其从稀疏文件转换为常规文件。 此属性仅在 Windows Server 2016 及更低版本上设置。
    M 进行数据访问时召回 指示文件的数据未完全存在于本地存储中。 读取文件会导致至少从服务器终结点所连接到的 Azure 文件共享提取部分文件内容。 此属性仅在 Windows Server 2019 及更高版本上设置。
    L 重分析点 指示该文件包含重分析点。 重分析点是供文件系统筛选器使用的特殊指针。 Azure 文件同步使用重分析点来定义 Azure 文件同步文件系统筛选器 (StorageSync.sys) 存储文件的云位置。 这样即可支持无缝访问。 用户无需知道是否使用了 Azure 文件同步或如何获取在 Azure 文件共享中的文件访问权限。 如果文件被完全召回,则 Azure 文件同步将从此文件中删除重分析点。
    O 脱机 指示文件的部分或全部内容未存储在磁盘上。 如果文件被完全召回,Azure 文件同步将删除此属性。

    文件的“属性”对话框(“详细信息”选项卡被选中)

    注意

    你可以通过向文件资源管理器的表显示添加“属性”字段,查看文件夹中所有文件的属性。 若要执行此操作,请右键单击现有的列(例如“大小”),选择“更多”,然后从下拉列表中选择“属性”

    注意

    所有这些属性也将对部分召回的文件可见。

  • “使用 fsutil 检查文件上的重分析点”。 如前面的选项中所述,分层的文件始终具有重分析点集。 重分析点使 Azure 文件同步文件系统筛选器驱动程序 (StorageSync.sys) 可以从未以本地方式存储在服务器上的 Azure 文件共享检索内容。

    若要查看文件是否包含重分析点,你可以在提升的命令提示符或 PowerShell 窗口中运行 fsutil 实用程序:

    fsutil reparsepoint query <your-file-name>
    

    如果文件包含重分析点,应能看到“重分析标记值: 0x8000001e”。 该十六进制值是 Azure 文件同步拥有的重分析点值。输出还会包含表示 Azure 文件共享中文件路径的重分析数据。

    警告

    同时,fsutil reparsepoint 实用程序命令还包含删除重分析点的功能。 除非 Azure 文件同步工程团队要求,否则请不要执行此命令。 运行此命令可能会导致数据丢失。

如何从分层中排除文件或文件夹

如果你要排除某些文件或文件夹的分层并将其保留在 Windows Server 本地,可以在 HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Azure\StorageSync 下配置 GhostingExclusionList 注册表设置。 可以按文件名、文件扩展名或路径排除文件。

若要从云分层中排除文件或文件夹,请执行以下步骤:

  1. 打开权限提升的命令提示符。

  2. 运行以下命令之一以配置排除项:

    要从分层中排除某些文件扩展名(例如,.one、.lnk、.log),请运行以下命令:
    reg ADD "HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Azure\StorageSync" /v GhostingExclusionList /t REG_SZ /d .one|.lnk|.log /f

    要从分层中排除特定文件名(例如 FileName.vhd),请运行以下命令:
    reg ADD "HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Azure\StorageSync" /v GhostingExclusionList /t REG_SZ /d FileName.vhd /f

    若要排除某个文件夹(例如 D:\ShareRoot\Folder\SubFolder)下的所有文件的分层,请运行以下命令:reg ADD "HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Azure\StorageSync" /v GhostingExclusionList /t REG_SZ /d D:\\ShareRoot\\Folder\\SubFolder /f

    要从分层中排除文件名、文件扩展名和文件夹的组合(例如,D:\ShareRoot\Folder1\SubFolder1,FileName.log,.txt),请运行以下命令:
    reg ADD "HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Azure\StorageSync" /v GhostingExclusionList /t REG_SZ /d D:\\ShareRoot\\Folder1\\SubFolder1|FileName.log|.txt /f

  3. 若要使云分层排除生效,必须运行以下命令来重启存储同步代理服务 (FileSyncSvc):
    net stop filesyncsvc
    net start filesyncsvc

分层下载

排除某个文件类型或模式时,将不再从该服务器对其进行分层。 但是,在不同终结点中更改或创建的所有文件将继续作为分层文件下载,并保持分层状态。 这些文件将根据排除策略逐渐召回。

例如,如果你排除 PDF 文件,则直接在服务器上创建的 PDF 文件将不会分层。 但是,在其他终结点(例如另一个服务器终结点或 Azure 文件共享)上创建的任何 PDF 文件仍将作为分层文件下载。 这些已排除的分层文件将在接下来的 3-4 天内完全召回。

如果你不希望任何文件处于分层状态,请启用主动召回。 此功能将阻止所有文件的分层下载并停止后台分层。

详细信息

  • 如果在故障转移群集上安装了 Azure 文件同步代理,则必须在 HKEY_LOCAL_MACHINE\Cluster\StorageSync\SOFTWARE\Microsoft\Azure\StorageSync 下创建 GhostingExclusionList 注册表设置
    • 示例:reg ADD "HKEY_LOCAL_MACHINE\Cluster\StorageSync\SOFTWARE\Microsoft\Azure\StorageSync" /v GhostingExclusionList /t REG_SZ /d .one|.lnk|.log /f
  • 注册表中的每个排除项都应使用管道符 (|) 分隔。
  • 指定要排除的路径时使用双反斜杠 (\\)。
    • 示例:reg ADD "HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Azure\StorageSync" /v GhostingExclusionList /t REG_SZ /d D:\\ShareRoot\\Folder\\SubFolder /f
  • 文件名或文件类型排除项适用于服务器上的所有服务器终结点。
  • 不能仅从特定文件夹中排除文件类型。
  • 排除不适用于已分层的文件。 使用 Invoke-StorageSyncFileRecall cmdlet 可召回已分层的文件。
  • 使用服务器上遥测事件日志中的事件 ID 9001 来检查配置的云分层排除项。 遥测事件日志位于事件查看器中的 Applications and Services\Microsoft\FileSync\Agent 下。

如何从云分层中上次访问时间跟踪中排除应用程序

当应用程序访问某个文件时,该文件的上次访问时间会在云分层数据库中更新。 扫描文件系统的应用程序(如防病毒软件)会导致所有文件具有相同的上次访问时间,这会影响文件的分层。

若要从上次访问时间跟踪中排除应用程序,请将进程排除项添加到 HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Azure\StorageSync 下的 HeatTrackingProcessNamesExclusionList 注册表设置中

示例:reg ADD "HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Azure\StorageSync" /v HeatTrackingProcessNamesExclusionList /t REG_SZ /d "SampleApp.exe|AnotherApp.exe" /f

如果在故障转移群集上安装了 Azure 文件同步代理,则必须在 HKEY_LOCAL_MACHINE\Cluster\StorageSync\SOFTWARE\Microsoft\Azure\StorageSync 下创建 HeatTrackingProcessNamesExclusionList 注册表设置。

示例:reg ADD "HKEY_LOCAL_MACHINE\Cluster\StorageSync\SOFTWARE\Microsoft\Azure\StorageSync" /v HeatTrackingProcessNamesExclusionList /t REG_SZ /d "SampleApp.exe|AnotherApp.exe" /f

注意

重复数据删除和文件服务器资源管理器 (FSRM) 进程将默认排除。 系统每五分钟接受一次对进程排除列表的更改。

如何访问热度存储

云分层使用文件的上次访问时间和访问频率来确定应进行分层的文件。 云分层筛选器驱动程序 (storagesync.sys) 会跟踪上次访问时间,并将信息记录在云分层热度存储中。 可以使用服务器-本地 PowerShell cmdlet 检索热度存储并将它保存到 CSV 文件中。

同一卷上的所有文件使用单个热度存储。 热度存储可能会变得非常大。 如果只需检索“最冷”的项数,请使用 -Limit 和一个数字,另外请考虑按子路径与卷根进行筛选。

  • 导入 PowerShell 模块:Import-Module '<SyncAgentInstallPath>\StorageSync.Management.ServerCmdlets.dll'

  • 卷可用空间:使用卷可用空间策略获取文件分层顺序的步骤:Get-StorageSyncHeatStoreInformation -VolumePath '<DriveLetter>:\' -ReportDirectoryPath '<FolderPathToStoreResultCSV>' -IndexName FilesToBeTieredBySpacePolicy

  • 日期策略:使用日期策略获取文件分层顺序的步骤:Get-StorageSyncHeatStoreInformation -VolumePath '<DriveLetter>:\' -ReportDirectoryPath '<FolderPathToStoreResultCSV>' -IndexName FilesToBeTieredByDatePolicy

  • 找到特定文件的热存储信息:Get-StorageSyncHeatStoreInformation -FilePath '<PathToSpecificFile>'

  • 按上次访问时间查看降序排列的所有文件:Get-StorageSyncHeatStoreInformation -VolumePath '<DriveLetter>:\' -ReportDirectoryPath '<FolderPathToStoreResultCSV>' -IndexName DescendingLastAccessTime

  • 查看按通过 PowerShell 后台召回或本地召回分层文件的顺序:Get-StorageSyncHeatStoreInformation -VolumePath '<DriveLetter>:\' -ReportDirectoryPath '<FolderPathToStoreResultCSV>' -IndexName OrderTieredFilesWillBeRecalled

如何强制对文件或目录进行分层

注意

选择要进行分层的目录时,只会对当时处于该目录中的文件进行分层。 在该时间之后创建的任何文件都不会自动进行分层。

启用云分层功能后,它会根据上次访问和修改时间自动分层文件,以实现云终结点上指定的卷可用空间百分比, 有时你可能需要手动强制分层文件。 如果你要保存在长时间内计划不再次使用的大型文件,并且想要将卷上现有可用空间用于其他文件和文件夹,则可使用此方法。 可使用以下 PowerShell 命令强制分层:

Import-Module "C:\Program Files\Azure\StorageSyncAgent\StorageSync.Management.ServerCmdlets.dll"
Invoke-StorageSyncCloudTiering -Path <file-or-directory-to-be-tiered>

如何将分层文件召回到磁盘

将文件召回到磁盘的最简单方法是打开此文件。 Azure 文件同步文件系统筛选器 (StorageSync.sys) 将会从 Azure 文件共享中无缝下载此文件。 对于可被部分读取或流式传输的文件类型(如多媒体文件或 .zip 文件),仅仅打开文件不会确保下载整个文件。

注意

如果快捷方式文件作为分层文件下拉到服务器,在通过 SMB 访问文件时可能出现问题。 为了缓解这个问题,有一个每三天运行一次的任务,会召回任何快捷方式文件。 然而,如果你希望更频繁地召回分层的快捷方式文件,可以创建一个计划任务,以所需的频率运行它:

Import-Module "C:\Program Files\Azure\StorageSyncAgent\StorageSync.Management.ServerCmdlets.dll" 
Invoke-StorageSyncFileRecall -Path <path-to-to-your-server-endpoint> -Pattern *.lnk

若要确保将文件完整下载到本地磁盘,必须使用 PowerShell 强制完整召回文件。 在需要同时召回多个文件(例如,一个文件夹内的所有文件)的情况下,也可能适合使用此选项。 打开已安装 Azure 文件同步的服务器节点的 PowerShell 会话,然后运行以下 PowerShell 命令:

Import-Module "C:\Program Files\Azure\StorageSyncAgent\StorageSync.Management.ServerCmdlets.dll"
Invoke-StorageSyncFileRecall -Path <path-to-to-your-server-endpoint>

可选参数:

  • -Order CloudTieringPolicy 会首先召回最近修改或访问的文件,并由当前分层策略所允许。
    • 如果配置了卷可用空间策略,则会召回文件,直到达到卷可用空间策略设置。 例如,如果卷可用空间策略设置为 20%,则一旦卷可用空间达到 20%,召回便会停止。
    • 如果配置了卷可用空间和日期策略,则会召回文件,直到达到卷可用空间或日期策略设置。 例如,如果卷可用空间策略设置为 20%,日期策略为 7天,则一旦卷可用空间达到 20% 或是 7 天内访问或修改的所有文件都在本地,召回便会停止。
  • -ThreadCount 决定可并行召回的文件数量(线程计数限制为 32)。
  • -PerFileRetryCount 确定尝试召回当前被阻止的文件的频率。
  • -PerFileRetryDelaySeconds 确定重试召回尝试之间的时间间隔(以秒为单位),并且此参数应始终与上一参数结合使用。

示例:

Import-Module "C:\Program Files\Azure\StorageSyncAgent\StorageSync.Management.ServerCmdlets.dll"
Invoke-StorageSyncFileRecall -Path <path-to-to-your-server-endpoint> -ThreadCount 8 -Order CloudTieringPolicy -PerFileRetryCount 3 -PerFileRetryDelaySeconds 10

注意

  • 如果承载服务器的本地卷没有足够可用空间可用于召回所有分层数据,则 Invoke-StorageSyncFileRecall cmdlet 会失败。

注意

若要召回已分层的文件,网络带宽应至少为 1 Mbps。 如果网络带宽小于 1 Mbps,则文件可能无法召回并出现超时错误。

后续步骤