快速入门：使用 Azure PowerShell 创建流分析作业

2024/11/26

Azure PowerShell 模块用于通过 PowerShell cmdlet 或脚本创建和管理 Azure 资源。本快速入门显示如何使用 Azure PowerShell 模块来部署并运行 Azure 流分析作业。

示例作业从 IoT 中心设备中读取流式处理数据。输入数据由 Raspberry Pi 联机模拟器生成。流分析作业使用流分析查询语言对数据进行转换，以便筛选所涉及的温度大于 27° 的消息。然后，作业将生成的输出事件写入到 Blob 存储的一个文件中。

准备阶段

如果没有 Azure 订阅，请创建试用版。
本快速入门需要 Azure PowerShell 模块。运行 Get-Module -ListAvailable Az 即可找到在本地计算机上安装的版本。如果需要进行安装或升级，请参阅安装 Azure PowerShell 模块。
某些 IoT 中心操作不受 Azure PowerShell 支持，必须使用 Azure CLI 2.0.70（或更高版本）和 Azure CLI 的 IoT 扩展来完成它们。安装 Azure CLI，并使用 az extension add --name azure-iot 来安装 IoT 扩展。

使用 Connect-AzAccount -Environment AzureChinaCloud 命令登录到 Azure 订阅，然后在弹出的浏览器中输入 Azure 凭据：

# Connect to your Azure account
Connect-AzAccount -Environment AzureChinaCloud

如果有多个订阅，请运行以下 cmdlet，选择要用于本快速入门的订阅。请确保将 <your subscription name> 替换为订阅的名称：

# List all available subscriptions.
Get-AzSubscription

# Select the Azure subscription you want to use to create the resource group and resources.
Get-AzSubscription -SubscriptionName "<your subscription name>" | Select-AzSubscription

创建资源组

使用 New-AzResourceGroup 创建 Azure 资源组。资源组是在其中部署和管理 Azure 资源的逻辑容器。

$resourceGroup = "StreamAnalyticsRG"
$location = "chinaeast"
New-AzResourceGroup `
    -Name $resourceGroup `
    -Location $location

对输入数据进行准备

在定义流分析作业之前，请对已配置为作业输入的数据进行准备。

以下 Azure CLI 代码块有多个命令来准备作业所需的输入数据。查看以下部分来了解代码。

在 PowerShell 窗口中运行 az login 命令，以便登录到 Azure 帐户。

当你成功登录后，Azure CLI 会返回订阅的列表。复制用于本快速入门的订阅，然后运行 az account set 命令以选择该订阅。选择在上一部分使用 PowerShell 选择的订阅。确保将 <your subscription name> 替换为订阅的名称。
```
az login

az account set --subscription "<your subscription>"
```
使用 az iot hub create 命令创建 IoT 中心。此示例创建名为 MyASAIoTHub 的 IoT 中心。由于 IoT 中心名称是唯一的，因此需使用你自己的 IoT 中心名称。将 SKU 设置为 F1 即可使用免费层，前提是它在订阅中可用。否则，请选择下一个最低的层。
```
az iot hub create --name "MyASAIoTHub" --resource-group $resourceGroup --sku S1
```
创建 IoT 中心以后，请使用 az iot hub connection-string show 命令获取 IoT 中心连接字符串。复制整个连接字符串并进行保存。在将 IoT 中心作为输入添加到流分析作业时，需要使用它。
```
az iot hub connection-string show --resource-group $resourceGroup --hub-name "MyASAIoTHub"
```
使用 az iot hub device-identity create 命令将设备添加到 IoT 中心。此示例创建名为 MyASAIoTDevice 的设备。
```
az iot hub device-identity create --resource-group $resourceGroup --hub-name "MyASAIoTHub" --device-id "MyASAIoTDevice"
```

使用 az iot hub device-identity connection-string show 命令获取设备连接字符串。复制整个连接字符串并将其保存。这样，在创建 Raspberry Pi 模拟器时，就可以使用该字符串。

az iot hub device-identity connection-string show --resource-group $resourceGroup --hub-name "MyASAIoTHub" --device-id "MyASAIoTDevice" --output table

输出示例：

HostName=MyASAIoTHub.azure-devices.net;DeviceId=MyASAIoTDevice;SharedAccessKey=a2mnUsg52+NIgYudxYYUNXI67r0JmNubmfVafojG8=

创建 Blob 存储

以下 Azure PowerShell 代码块使用命令来创建用于作业输出的 Blob 存储。查看介绍代码的部分。

使用 New-AzStorageAccount cmdlet 创建标准的常规用途存储帐户。本示例创建一个名为 myasaquickstartstorage 的存储帐户，该帐户默认启用本地冗余存储 (LRS) 和 Blob 加密。
检索存储帐户上下文 $storageAccount.Context，该上下文定义要使用的存储帐户。使用存储帐户时，请引用上下文而不是重复提供凭据。
使用 New-AzStorageContainer 创建存储容器。

复制代码所输出的存储密钥，然后保存该密钥，以便稍后创建流式处理作业的输出。

$storageAccountName = "myasaquickstartstorage"
$storageAccount = New-AzStorageAccount `
  -ResourceGroupName $resourceGroup `
  -Name $storageAccountName `
  -Location $location `
  -SkuName Standard_LRS `
  -Kind Storage

$ctx = $storageAccount.Context
$containerName = "container1"

New-AzStorageContainer `
  -Name $containerName `
  -Context $ctx

$storageAccountKey = (Get-AzStorageAccountKey `
  -ResourceGroupName $resourceGroup `
  -Name $storageAccountName).Value[0]

Write-Host "The <storage account key> placeholder needs to be replaced in your output json files with this key value:"
Write-Host $storageAccountKey -ForegroundColor Cyan

创建流分析作业

请使用 New-AzStreamAnalyticsJob cmdlet 创建流分析作业。此 cmdlet 使用作业名称、资源组名称、位置和 SKU 名称作为参数。作业名称可以是用于标识作业的任何友好名称，但只能包含字母数字字符、连字符和下划线，且其长度必须介于 3 到 63 个字符之间。

运行 New-AzStreamAnalyticsJob cmdlet。

$jobName = "MyStreamingJob"
New-AzStreamAnalyticsJob `
  -ResourceGroupName $resourceGroup `
  -Name $jobName `
  -Location chinanorth `
  -SkuName Standard

配置作业输入

使用 New-AzStreamAnalyticsInput cmdlet 将输入添加到作业。此 cmdlet 使用作业名称、作业输入名称、资源组名称和作业输入定义作为参数。作业输入定义是一个 JSON 文件，其中包含配置作业的输入所需的属性。在此示例中，需将 Blob 存储创建为输入。

在本地计算机上创建名为 JobInputDefinition.json 的文件，并向其添加以下 JSON 数据。

重要

将 accesspolicykey 替换为在上一部分保存的 IoT 中心设备连接字符串的 SharedAccessKey 部分。
如果为 IoT 中心使用了其他名称，请更新 iotHubNamespace 的值。

{
    "properties": {
        "type": "Stream",
        "datasource": {
            "type": "Microsoft.Devices/IotHubs",
            "properties": {
                "iotHubNamespace": "MyASAIoTHub",
                "sharedAccessPolicyName": "iothubowner",
                "sharedAccessPolicyKey": "accesspolicykey",
                "endpoint": "messages/events",
                "consumerGroupName": "$Default"
                }
        },
        "compression": {
            "type": "None"
        },
        "serialization": {
            "type": "Json",
            "properties": {
                "encoding": "UTF8"
            }
        }
    },
    "name": "IoTHubInput",
    "type": "Microsoft.StreamAnalytics/streamingjobs/inputs"
}

将 $jobInputDefinitionFile PowerShell 变量设置为存储作业输入定义 JSON 文件的路径。

$jobInputDefinitionFile = "C:\JobInputDefinition.json"

接下来，运行 New-AzStreamAnalyticsInput cmdlet，为流分析作业创建 Azure IoT 中心输入。

$jobInputName = "IoTHubInput"
New-AzStreamAnalyticsInput `
  -ResourceGroupName $resourceGroup `
  -JobName $jobName `
  -File $jobInputDefinitionFile `
  -Name $jobInputName

配置作业输出

使用 New-AzStreamAnalyticsOutput cmdlet 将输出添加到作业。此 cmdlet 使用作业名称、作业输出名称、资源组名称和作业输出定义作为参数。作业输出定义是一个 JSON 文件，其中包含配置作业的输出所需的属性。此示例使用 Blob 存储作为输出。

在本地计算机上创建名为 JobOutputDefinition.json 的文件，并向其添加以下 JSON 数据。

重要

将 accountKey 的值替换为存储帐户的访问密钥，该密钥是存储在 $storageAccountKey 值中的值。

{
    "properties": {
        "datasource": {
            "type": "Microsoft.Storage/Blob",
            "properties": {
                "storageAccounts": [
                    {
                      "accountName": "asaquickstartstorage",
                      "accountKey": "<storage account key>"
                    }
                ],
                "container": "container1",
                "pathPattern": "output/",
                "dateFormat": "yyyy/MM/dd",
                "timeFormat": "HH"
            }
        },
        "serialization": {
            "type": "Json",
            "properties": {
                "encoding": "UTF8",
                "format": "LineSeparated"
            }
        }
    },
    "name": "BlobOutput",
    "type": "Microsoft.StreamAnalytics/streamingjobs/outputs"
}

将 $jobOutputDefinitionFile PowerShell 变量设置为存储作业输出定义 JSON 文件的路径。

$jobOutputDefinitionFile = "C:\JobOutputDefinition.json"

接下来，运行 New-AzStreamAnalyticsOutput cmdlet，为流分析作业创建 Azure Blob 存储输出。

$jobOutputName = "BlobOutput"

New-AzStreamAnalyticsOutput `
  -ResourceGroupName $resourceGroup `
  -JobName $jobName `
  -File $jobOutputDefinitionFile `
  -Name $jobOutputName

定义转换查询

使用 New-AzStreamAnalyticsTransformation cmdlet 将转换添加到作业。此 cmdlet 使用作业名称、作业转换名称、资源组名称和作业转换定义作为参数。在本地计算机上创建名为 JobTransformationDefinition.json 的文件，并向其添加以下 JSON 数据。此 JSON 文件包含一个查询参数，用于定义转换查询：

{
    "name":"MyTransformation",
    "type":"Microsoft.StreamAnalytics/streamingjobs/transformations",
    "properties":{
        "streamingUnits":1,
        "script":null,
        "query":"SELECT * INTO BlobOutput FROM IoTHubInput WHERE Temperature > 27"
    }
}

接下来运行 New-AzStreamAnalyticsTransformation cmdlet。

$jobTransformationName = "MyJobTransformation"
$jobTransformationDefinitionFile = "C:\JobTransformationDefinition.json"
New-AzStreamAnalyticsTransformation `
    -ResourceGroupName $resourceGroup `
    -JobName $jobName `
    -Query "SELECT * INTO BlobOutput FROM IoTHubInput WHERE Temperature > 27" `
    -StreamingUnit 1 `
    -Name $jobTransformationName

运行 IoT 模拟器

打开 Raspberry Pi Azure IoT 联机模拟器。
将第 15 行的占位符替换为在上一部分保存的整个 Azure IoT 中心设备连接字符串。
单击 “运行” 。输出会显示传感器数据和发送到 IoT 中心的消息。

启动流分析作业并检查输出

请使用 Start-AzStreamAnalyticsJob cmdlet 启动作业。此 cmdlet 使用作业名称、资源组名称、输出启动模式和启动时间作为参数。 OutputStartMode 接受的值为 JobStartTime、CustomTime 或 LastOutputEventTime。若要详细了解每个值是指什么，请参阅 PowerShell 文档中的参数部分。

以下 cmdlet 在运行以后会返回 True 作为输出（如果作业启动）。在存储容器中，创建的输出文件夹包含已转换的数据。

Start-AzStreamAnalyticsJob `
  -ResourceGroupName $resourceGroup `
  -Name $jobName `
  -OutputStartMode 'JobStartTime'

清理资源

若不再需要资源组、流式处理作业以及所有相关资源，请将其删除。删除作业可避免对作业使用的流单元进行计费。如果计划在将来使用该作业，可以跳过删除它的操作，暂时只需停止该作业。如果不打算继续使用该作业，请运行以下 cmdlet，删除本快速入门创建的所有资源：

Remove-AzResourceGroup `
  -Name $resourceGroup

后续步骤

在本快速入门中，你使用 PowerShell 部署了一个简单的流分析作业。你还可以使用 Azure 门户部署流分析作业。

若要了解如何配置其他输入源并执行实时检测，请继续阅读以下文章：

使用 Azure 流分析实时检测欺诈行为

通过