使用Azure数据工厂或Synapse加载多个文件
我正在从SSIS移到Azure。 我们有100个文件和MSSQL表,我们希望将其推入Gen2 Data Lake 使用3个区域,然后使用SQL数据湖 区域是原始的,登台的和amp;演示文稿(按照您的意愿更改名称),
什么是尽可能多的最佳过程 例如,构建一个带有文件 /文件夹 /表的表格,以将其带入原始区域 然后让Synapse带来这些对象的满负荷或增量负载 然后将它们处理到接下来的两个区域中,随着我们的进展,我猜更多的自定义代码。
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
data:image/s3,"s3://crabby-images/d5906/d59060df4059a6cc364216c4d63ceec29ef7fe66" alt="扫码二维码加入Web技术交流群"
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
您的要求可以使用Azure数据工厂中的多个
活动
来完成。要迁移SSIS软件包,您需要使用SSIS集成运行时(IR)。 ADF支持SSIS集成,可以通过创建新的SSIS集成运行时进行配置。要创建相同的内容,请单击配置SSIS集成,提供基本详细信息并创建一个新的运行时。
请参阅下面的图像以创建新的SSIS IR。
请参考此第三 - 派对教程 sqlshack 将本地SSIS软件包移至Azure Data Factory。
现在,使用
复制活动
将数据复制到不同区域。您可以使用复制活动将数据的副本与您的需求相同。请参阅复制azure数据存储之间的数据使用Azure数据工厂。ADF还使用更改数据捕获(CDC)支持增量加载数据。
注意: Azure SQL MI和SQL Server都支持更改数据捕获技术。
需要配置翻滚窗口触发器和CDC窗口参数以使增量负载自动化。检查。
最后一部分:
,您需要通过编程管理,因为ADF中没有可用的功能可以根据CDC更新数据的其他副本。您需要为这些区域创建单独的CDC,或者是逻辑上的。
Your requirement can be accomplished using multiple
activities
in Azure Data Factory.To migrate SSIS packages, you need to use SSIS Integrated Runtime (IR). ADF supports SSIS Integration which can be configured by creating a new SSIS Integration runtime. To create the same, click on the Configure SSIS Integration, provide the basic details and create a new runtime.
Refer below image to create new SSIS IR.
Refer this third-party tutorial by SQLShack to Move local SSIS packages to Azure Data Factory.
Now, to copy the data to different zones using
copy activity
. You can make as much copy of your data as your requirement using copy activity. Refer Copy data between Azure data stores using Azure Data Factory.ADF also supports Incrementally load data using Change Data Capture (CDC).
Note: Both Azure SQL MI and SQL Server support the Change Data Capture technology.
Tumbling window trigger and CDC window parameters need to be configured to make the incremental load automated. Check this official tutorial.
The last part:
This you need to manage programmatically as there is no such feature available in ADF which can update the other copies of the data based on CDC. You need to either create a separate CDC for those zones or do it logically.