适用于:
Azure Data Factory
Azure Synapse Analytics
本文介绍一个解决方案模板,可用于使用 Foundry Tools 检测和屏蔽数据流中的 PII 数据。
关于此解决方案模板
此模板从Azure Data Lake Storage Gen2源检索数据集。 然后,创建包含派生列的请求正文,外部调用转换操作会调用 Foundry Tools,并在数据加载到目标接收器之前对 PII 进行掩盖处理。
该模板包含一个活动:
- “数据流”,用于检测 PII 数据并对其进行掩码
此模板定义 3 个参数:
- sourceFileSystem 是用于从源存储位置读取文件的文件夹路径。 需将默认值替换为自己的文件夹路径。
- sourceFilePath 是从中读取源存储内的文件的子文件夹路径。 需将默认值替换为自己的子文件夹路径。
- sourceFileName 是要转换的文件的名称。 需将默认值替换为自己的文件名。
先决条件
- Azure AI 服务资源端点 URL 和密钥(在此处创建新的资源 here)
如何使用此解决方案模板
浏览模板库或通过筛选找到模板,然后转到“PII 检测和掩码”模板。
使用下拉菜单“新建”与源存储的连接,或选择现有连接。 要从中读取文件的源存储库。
单击“新建”将需要创建新的链接服务连接。
使用下拉列表创建与 Azure 人工智能服务资源的新连接,或选择现有连接。 需要终结点 URL 和资源密钥才能创建此连接。
单击“新建”将需要创建新的链接服务连接。 请确保在 Auth 标头“Ocp-Apim-Subscription-Key”下输入资源的终结点 URL 和资源密钥。
选择“使用此模板”以创建管道。
你应该会看到以下流水线:
单击进入数据流活动将显示以下数据流:
启用“数据流调试”。
更新“调试设置”中的参数,并单击“保存”。
在“数据预览”中预览结果。
当数据预览结果符合预期时,请更新“参数”。
返回到管道,然后选择“调试”。 查看结果并发布。