数据工厂 Data Factory

可大规模简化 ETL 的混合数据集成服务


定价详细信息

Azure 数据工厂:数据管道定价

数据管道定价的计算依据如下:

  • 管道业务流程和执行
  • 数据流执行和调试
  • 数据工厂操作(例如创建管道和管道监视)的数量

数据工厂管道业务流程和执行

管道是被称为活动的离散步骤的控制流。需要按集成运行时小时,为活动运行和活动执行使用的数据管道业务流程付费。此集成运行时(在 Azure 中无服务器并且自承载在混合方案中)提供用于在管道中执行活动的计算资源。

例如,Azure 数据工厂复制活动可以通过安全、可靠、高性能且可缩放的方式,在各种数据存储间移动数据。当数据量或吞吐量需要增长时,集成运行时可以进行缩放以满足这些需求。

*以下价格均为含税价格。
类型 Azure 集成运行时价格 5 已启用托管虚拟网络的Azure集成运行时价格 5 自承载集成运行时价格 5
业务流程 1 ¥10.176 每 1,000 次运行 ¥10.176 每 1,000 次运行 ¥15.264 每 1,000 次运行
数据移动活动 2 ¥2.544/DIU小时 ¥2.544/DIU-小时 ¥1.018/小时
管道活动 3 ¥0.0509/小时 ¥10.176 /小时 (最多50个并行管道活动) ¥0.0204/小时
外部管道活动 4 ¥0.00254/小时 ¥10.176 /小时 (最多800个并行管道活动) ¥0.00102/小时
1 业务流程是指活动运行、触发器执行和调试运行。

2 使用复制活动从 Azure 数据中心获取数据将产生额外的网络带宽费用,这将在帐单上显示为单独的出站数据传输行项。 了解有关出站数据传输定价的详细信息。
3 管道活动在集成运行时上执行。管道活动包括查找、获取元数据、删除及创作期间的架构操作(测试连接、浏览文件夹列表和表格列表、获取架构及预览数据)。
4 外部管道活动是托管在集成运行时上的,但是是在链接的服务上执行的。外部活动包括 Databricks、存储过程、HDInsight 活动等。有关外部活动的完整列表,请参阅 此处 。对于映射数据流活动,请参阅下方的“数据工厂数据流执行和调试”部分。
5 Azure 集成运行时和Azure托管的VNET集成运行时启用生存时间 (TTL) 时,集成运行时的计算大小将根据配置保留,并且无法自动缩放。详情请参考为你的方案选择适当的集成运行时配置。点击此处了解不同集成运行时类型下的定价模型的示例。

数据流执行和调试

数据流是数据工厂中直观设计的组件,可实现大规模数据转换。你按每小时每个 vCore 对数据流群集执行和调试进行付费。要运行数据流的最小群集大小是 8 个 vCore。执行和调试费用按分钟计费并向上舍入。

类型 价格
计算优化 ¥1.23/每vCore/每小时
常规用途 ¥1.81/每vCore/每小时
内存优化 ¥2.51/每vCore/每小时
注意: 数据工厂数据流还将对数据流执行和调试所需的托管、磁盘和 blob 存储进行计费。此外,以公共预览版的形式推出“整理数据流”功能时,将按上表中所列价格的 50% 来收取该功能的使用费用。

数据工厂操作

*以下价格均为含税价格。
类型 价格 示例
读取/写入 * ¥5.088/每 50,000 个已修改/引用的实体 在 Azure 数据工厂中读取/写入实体 *
监视 ¥2.544/每 50,000 个已检索的运行记录 监视管道、活动、触发器和调试运行 **
* 针对 Azure 数据工厂实体的读取/写入操作包括创建、读取、更新和删除。实体包括数据集、链接的服务、管道、集成运行时和触发器。

** 监视操作包括获取和列出管道、活动、触发器和调试运行。

非活动管道

如果管道没有任何相关联的触发器或在一个月内没有任何运行,则将被视为非活动管道。非活动管道按每月 ¥8.141 收费。

常见问题

全部展开
  • 什么是 Azure 数据工厂读取/写入操作?

    读取/写入操作包括创建、读取、更新和删除 Azure 数据工厂实体。实体包括数据集、链接的服务、管道、集成运行时和触发器。

  • 什么是 Azure 数据工厂监视操作?

    监视操作包括获取和列出管道、活动、触发器和调试运行。

  • 什么是活动?什么是运行?

    活动是管道内的一个步骤。每个活动的执行被称为运行。

  • 什么是集成运行时?

    集成运行时是 Azure 数据工厂用于在不同的网络环境之间提供以下数据集成功能的计算基础结构:

    • 数据移动:在公用网络和专用(本地或虚拟专用)网络中存储的数据之间进行数据传输,从而为内置连接器、格式转换、列映射和高性能且可伸缩的数据传输提供支持。
    • 活动分派:分派和监视在各种计算服务(如 Azure HDInsight、Azure 机器学习、Azure SQL 数据库、SQL Server 等等)上运行的转换活动。
    • SQL Server Integration Services 包执行:在托管的 Azure 计算环境中本机执行 SQL Server 集成服务包。
  • 什么是触发器,以及什么是触发器运行?

    触发器是一个处理单元,用于确定何时需要启动管道执行。触发器运行表示执行触发器,在满足条件的情况下,这可能会产生活动运行。

  • 什么是调试运行?

    调试运行是一项测试运行,用户可以在迭代开发期间执行此运行以确保在对数据工厂的更改发布之前,管道中的步骤能按预期工作。

  • 什么是非活动管道,何时将对它进行收费?

    非活动管道是没有与触发器相关联且在一个月内没有任何运行的管道。在一个月没有任何运行后将产生费用。

  • 管道操作如何收费?

    管道执行活动(Azure 集成运行时数据移动、管道活动、外部和自承载集成运行时数据移动、管道活动和外部)按上述小时费率计费。管道执行收费按分钟计费,并向上舍入。

    例如: 如果运行的操作用了 2 分 20 秒,则按 3 分钟计费。

  • 在何处可以查找定价示例?

    Azure 数据工厂文档 页面上查找基于方案的定价示例。

支持和服务级别协议

如有任何疑问或需要帮助,请访问 Azure 支持 选择自助服务或者其他任何方式联系我们获得支持。

若要了解有关我们的服务器级别协议的详细信息,请访问 服务级别协议 页。