将数据从 Logstash 引入 Azure 数据资源管理器

重要

此连接器可用于 Microsoft Fabric 中的实时智能。 使用本文中的说明时,请注意以下例外情况:

Logstash 是一个开源服务器端数据处理管道,可以同时从多个源引入数据、转换数据,然后将数据发送到你偏好的“储存”中。 在本文中,你要将该数据发送到 Azure 数据资源管理器 - 用于日志和遥测数据的快速且高度可缩放的数据探索服务。 首先你将在测试群集中创建一个表和数据映射,然后指示 Logstash 将数据发送到该表,并验证结果。

注意

此连接器目前仅支持 json 数据格式。

先决条件

  • Microsoft 帐户或 Microsoft Entra 用户标识。 无需 Azure 订阅。
  • Azure 数据资源管理器群集和数据库。 创建群集和数据库
  • Logstash 版本 6+ 安装说明

创建表

准备好群集和数据库之后,可以创建一个表。

  1. 在数据库查询窗口中运行以下命令,以创建表:

    .create table logs (timestamp: datetime, message: string)
    
  2. 运行以下命令,确认已创建新表 logs 并且该表是空的:

    logs
    | count
    

创建映射

Azure 数据资源管理器使用映射将传入的数据转换为目标表架构。 以下命令创建名为 basicmsg 的新映射。该映射根据 path 的指定从传入的 json 中提取属性,然后将这些属性输出到 column

在查询窗口中运行以下命令:

.create table logs ingestion json mapping 'basicmsg' '[{"column":"timestamp","path":"$.@timestamp"},{"column":"message","path":"$.message"}]'

安装 Logstash 输出插件

Logstash 输出插件与 Azure 数据资源管理器通信,并将数据发送到服务。 有关详细信息,请参阅 Logstash 插件

在命令 shell 中,导航到 Logstash 根目录,然后运行以下命令以安装插件:

bin/logstash-plugin install logstash-output-kusto

配置 Logstash 以生成示例数据集

Logstash 可以生成用于测试端到端管道的示例事件。 如果你正在使用 Logstash 并且有权访问自己的事件流,请跳到下一部分。

注意

如果使用自己的数据,请更改上一步骤中定义的表和映射对象。

  1. 编辑包含所需管道设置的新文本文件(使用 vi):

    vi test.conf
    
  2. 粘贴以下设置,告知 Logstash 生成 1000 个测试事件:

    input {
        stdin { }
        generator {
            message => "Test Message 123"
            count => 1000
        }
    }
    

此配置还包括 stdin 输入插件。使用该插件可以自行编写更多的消息(请务必使用 Enter 将消息提交到管道中)。

配置 Logstash 以将数据发送到 Azure 数据资源管理器

将以下设置粘贴到在上一步骤中使用的同一配置文件中。 请将所有占位符替换为相关的设置值。 有关详细信息,请参阅创建 Microsoft Entra 应用程序

output {
    kusto {
            path => "/tmp/kusto/%{+YYYY-MM-dd-HH-mm-ss}.txt"
            ingest_url => "https://ingest-<cluster name>.kusto.chinacloudapi.cn/"
            app_id => "<application id>"
            app_key => "<application key/secret>"
            app_tenant => "<tenant id>"
            database => "<database name>"
            table => "<target table>" # logs as defined above
            json_mapping => "<mapping name>" # basicmsg as defined above
    }
}
参数名称 说明
路径 Logstash 插件会将事件写入临时文件,然后将其发送到 Azure 数据资源管理器。 此参数包含要将文件写入到的路径,以及一个用于轮转文件的时间表达式,该表达式可触发上传到 Azure 数据资源管理器服务的操作。
ingest_url 用于进行引入相关通信的 Kusto 终结点。
app_idapp_keyapp_tenant 连接到 Azure 数据资源管理器所需的凭据。 请务必使用具有引入特权的应用程序。
database 要将事件放入到的数据库的名称。
table 要将事件放入到的目标表的名称。
json_mapping mapping(映射)用于将传入事件的 json 字符串映射为正确的行格式(定义哪些属性要进入哪个列)。

运行 Logstash

现在,可以运行 Logstash 并测试设置。

  1. 在命令 shell 中,导航到 Logstash 根目录,然后运行以下命令:

    bin/logstash -f test.conf
    

    屏幕上应会输出信息,然后输出示例配置生成的 1000 条消息。 此时还可以手动输入更多消息。

  2. 几分钟后,请运行以下数据资源管理器查询来查看所定义的表中的消息:

    logs
    | order by timestamp desc
    
  3. 按 Ctrl+C 退出 Logstash

清理资源

在数据库中运行以下命令以清理 logs 表:

.drop table logs