治理、保护和管理数据资产

Microsoft Purview 是一项统一的数据治理服务,有助于最大化混合数据的商业价值。使用 Microsoft Purview 数据映射,可以大规模自动扫描并分类数据。使用 Microsof Purview 数据目录,可以进行自助式数据发现,从而加快 BI、分析、AI 和 ML。

价格详情

Microsoft Purview 数据映射

Microsoft Purview 数据映射将与数据资产关联的元数据、注释和关系存储在可搜索的知识图中。

最终用户通过专门生成的应用程序(例如数据目录、Data Estate Insights 等)使用数据映射中的技术元数据、世系、分类和其他信息。

数据映射以云规模填充,并通过自动扫描、分类和更新(来自配置为使用 Microsoft Purview 帐户进行发现的云和本地中的数据系统)来保持最新状态。

可以处理数据映射中包含的信息以扩充数据映射,从而简化搜索、生成见解、优化数据资产的存储等。

开发人员还可以使用开放式 API (包括 Apache Atlas、扫描 API 等)生成由 Microsoft Purview 数据映射提供支持的自己的应用。

数据映射按三种类型的活动计费:

• 数据映射填充 – 示例包括基于元数据和内容检查的元数据和世系提取或分类。

• 数据映射扩充 – 示例包括使用资源集优化数据湖资产的存储,或聚合分类以生成见解。

• 数据映射消耗- 示例包括提供搜索结果或呈现世系图。这还包括使用 Apache Atlas API 在数据映射上生成应用。

示例方案:

除上述内容外,此处还提供了更多有关正式发布中定价工作原理的信息,从而帮助估算成本。

数据映射可根据请求负载弹性缩放容量。按每秒数据映射操作数测量请求负载。作为一种成本控制措施,数据映射默认配置为在弹性窗口内弹性缩放。

数据映射(Always on): 1 个容量单位 × 每小时每个容量单位 ¥4.18 × 744 小时,最多 10 GB 元数据存储和每秒 25 次操作

扫描(即用即付): 一个月内所有扫描的总持续分钟数 [M] /每小时 60 分钟 × 每次扫描 32 个 vCore × 每小时每个 vCore ¥6.41

资源集: 一个月内处理高级资源集数据资产的总持续小时数 [H] * 每小时每个 vCore ¥2.14

数据映射填充

自动扫描、引入和分类

数据映射填充为无服务器计算,且根据扫描持续时间(包括元数据提取和分类)和引入作业计费。使用本机连接器的自动扫描会触发扫描和引入作业。来自 Microsoft Purview 客户端的基于推送的更新(例如,来自 Azure 数据工厂的世系推送)仅触发引入作业。

这些作业的持续时间可能因扫描的系统数或推送更新的系统数、扫描的系统中包含的数据资产、选定的分类数、数据形状和扫描的系统性能而异。

价格
对于 Power BI Online 限时免费
对于本地 SQL Server 限时免费
对于其他数据源 ¥6.41 每 vCore 每小时

注意: 扫描和引入作业不包括使用 Apache Atlas 添加或修改实体,而是根据请求负载驱动的容量单位(按操作/秒)计为数据映射消耗。

注意: Microsoft Purview 在预配 Microsoft Purview 帐户的订阅内将存储帐户和 Azure 事件中心帐户预配为托管资源。此为扫描期间支持增强型安全功能的必需项。这可能会产生单独费用,在大多数情况下,不会超过扫描费用的 2%。请参阅 Azure 门户中 Azure Purview Resource JSON 内的“托管资源”节。

注意: 使用 Microsoft Purview 治理其他云(例如 AWS、GCP)中的数据的客户可能会因数据传输和 API 调用(与将元数据发布到 Microsoft Purview 数据映射关联)而产生额外费用。此费用因地区而异。有关扫描 AWS 中数据的信息,请参阅 AWS 管理控制台内的“计费和管理”控制台,从而查看这些费用。

数据映射扩充

高级资源集

高级资源集是数据映射的内置功能,用于优化与数据湖中分区文件关联的数据资产的存储和搜索。处理资源集数据资产的计费为无服务器计算,且以处理的持续时间为基础,该时间可能因已配置的分区文件和资源集配置文件中的更改而异。

价格
高级资源集 ¥2.14 每 vCore 每小时
注意: 默认情况下,对于配置为在启用资源集切换的情况下进行扫描的所有系统,高级资源集处理每 12 小时运行一次。

Insights 生成

Insights 生成将原始数据映射中的元数据和分类聚合为可在数据资产见解应用程序中可视化的可执行扩充报告,以及可导出的业务友好格式的精细资产级别信息。报告可视化和导出会因数据资产见解应用程序中的见解报告使用而产生费用。

价格
报告生成 ¥8.34 每 vCore 每小时
注意: 默认情况下,Insights 生成在预配时启用,且可以在 Microsoft Purview 治理门户的管理中心内禁用。禁用 Insights 生成将停止刷新 Data Estate Insights 应用程序中的报告。默认情况下,Insights 生成会根据数据映射更新自动运行。

数据映射消耗

弹性数据映射

默认情况下,Microsoft Purview 帐户预配至少 1 个容量单位的数据映射。1 个容量单位支持每秒最多 25 项数据映射操作的请求,且包含最多 10 GB 数据资产元数据存储。第一个 1MB 的数据映射元数据存储对所有客户都是免费的。 数据映射可以基于请求负载弹性缩放容量。请求负载按每秒数据映射操作数进行度量。作为成本控制度量值,数据映射默认配置为在弹性窗口内弹性扩展。

数据映射操作指的是创建、读取、更新或删除数据映射中的实体。实体示例包括数据资产或两个数据资产之间的世系关系。搜索请求可能需要执行多项操作,具体取决于返回的资产和请求的复杂性。实体的存储大小可能因实体类型和与实体关联的注释而异。

对于所需的每 10 GB 元数据存储,数据映射需要一个额外的容量单位。例如,具有 10 GB 元数据存储的数据映射按每小时 1 个“容量单位”计费。如果新的数据资产将大小增加到 10.1 GB,则数据映射按每小时 2 个“容量单位”计费。

价格 包含的数量
容量单位 ¥4.18/容量单位/小时 1MB 数据映射元数据存储

Microsoft Purview 应用程序

Microsoft Purview 应用程序是基于数据映射(包括数据目录、Data Estate Insights 等)生成的一组可独立采用且高度集成的用户体验。这些应用程序由数据使用者、生成者、数据专员和主管使用,使企业能够确保数据易于发现、理解、高质量,且所有用途都符合企业和法规要求。

数据目录

数据目录是一款基于数据映射生成的应用程序,供业务用户、数据工程师和专员用于快速、轻松地发现数据、识别世系关系和分配业务上下文。

标记为“包含在数据映射中”的功能计为数据映射容量单位消耗。

功能 价格
搜索和浏览数据资产 包含在数据映射中
业务术语表 包含在数据映射中
世系可视化效果 包含在数据映射中
自助式数据访问 预览版中免费

Data Estate Insights

数据资产见解是一款基于数据映射生成的应用程序,供数据主管和专员用于了解其各种数据资产的数据资产运行状况和治理状况,并推动采取纠正措施以缩小差距。数据资产见解提供通过见解生成而生成的扩充数据,这些数据按上述数据映射扩充中所示(见解生成部分)单独收费。

见解消耗按 API 调用计费。一个 API 调用最多返回 10,000 行表格结果。

价格
Insights 消耗 每个 API 调用 ¥2.14