快速入门：使用无服务器 SQL 池

Synapse 无服务器 SQL 池是一个无服务器查询服务，可用于针对 Azure 存储中放置的文件运行 SQL 查询。本快速入门介绍如何使用无服务器 SQL 池查询各种类型的文件。有关受支持格式的列表，请参阅 OPENROWSET。

本快速入门介绍如何查询 CSV、Apache Parquet 和 JSON 文件。

先决条件

选择用于发出查询的 SQL 客户端：

Azure Synapse Studio 是一个 Web 工具，可用于浏览存储中的文件以及创建 SQL 查询。
包含 mssql 扩展的 Visual Studio Code 是一个跨平台的轻型开发人员和数据工具，可让你在按需数据库上运行 SQL 查询和笔记本。
SQL Server Management Studio 是一个客户端工具，可用于针对按需数据库运行 SQL 查询。

本快速入门使用以下参数：

参数	DESCRIPTION
无服务器 SQL 池服务终结点地址	用作服务器名称
无服务器 SQL 池服务终结点区域	用于确定要在示例中使用的存储
用来访问终结点的用户名和密码	用于访问终结点
用于创建视图的数据库	在示例中从其着手的数据库

首次设置

在使用示例之前，请执行以下操作：

为视图创建数据库（若要使用视图）。
创建供无服务器 SQL 池用来访问存储中的文件的凭据。

创建数据库

创建自己的用于演示目的的数据库。你将使用此数据库来创建视图，并将此数据库用于本文中的示例查询。

注释

数据库仅用于视图元数据，而不用于实际数据。请记下数据库名称，以便稍后在本快速入门中使用。

使用以下 T-SQL 命令（请将 <mydbname> 更改为你选择的名称）：

CREATE DATABASE <mydbname>

创建数据源

若要使用无服务器 SQL 池运行查询，请创建可供无服务器 SQL 池用来访问存储中的文件的数据源。执行以下代码片段，以创建此部分的示例中使用的数据源。将 <strong-password-here> 替换为所选的强密码。

-- create master key that will protect the credentials:
CREATE MASTER KEY ENCRYPTION BY PASSWORD = '<strong-password-here>'

-- create credentials for containers in our demo storage account
CREATE DATABASE SCOPED CREDENTIAL sqlondemand
WITH IDENTITY='SHARED ACCESS SIGNATURE',  
SECRET = 'sv=2022-11-02&ss=b&srt=co&sp=rl&se=2042-11-26T17:40:55Z&st=2024-11-24T09:40:55Z&spr=https&sig=DKZDuSeZhuCWP9IytWLQwu9shcI5pTJ%2Fw5Crw6fD%2BC8%3D'
GO
CREATE EXTERNAL DATA SOURCE SqlOnDemandDemo WITH (
    LOCATION = 'https://sqlondemandstorage.blob.core.windows.net',
    CREDENTIAL = sqlondemand
);

查询 CSV 文件

下图显示了要查询的文件的预览：

屏幕截图显示不带标题的 CSV 文件的前 10 行，Windows 样式的换行符。

以下查询展示了如何读取不包含标题行、包含 Windows 样式换行符和逗号分隔列的 CSV 文件：

SELECT TOP 10 *
FROM OPENROWSET
  (
      BULK 'csv/population/*.csv',
      DATA_SOURCE = 'SqlOnDemandDemo',
      FORMAT = 'CSV', PARSER_VERSION = '2.0'
  )
WITH
  (
      country_code VARCHAR (5)
    , country_name VARCHAR (100)
    , year smallint
    , population bigint
  ) AS r
WHERE
  country_name = 'Luxembourg' AND year = 2017

可以在查询编译时指定架构。如需更多示例，请参阅查询 CSV 文件。

查询 Parquet 文件

以下示例演示用于查询 Parquet 文件的自动架构推理功能。该示例在不指定架构的情况下返回 2017 年 9 月的行数。

注释

读取 Parquet 文件时，不一定要在 OPENROWSET WITH 子句中指定列。在这种情况下，无服务器 SQL 池会利用 Parquet 文件中的元数据，并按名称绑定列。

SELECT COUNT_BIG(*)
FROM OPENROWSET
  (
      BULK 'parquet/taxi/year=2017/month=9/*.parquet',
      DATA_SOURCE = 'SqlOnDemandDemo',
      FORMAT='PARQUET'
  ) AS nyc

有关详细信息，请参阅使用无服务器 SQL 池查询 Parquet 文件。

查询 JSON 文件

JSON 示例文件

文件存储在 json 容器的文件夹 books 中，包含采用以下结构的单个书籍条目：

{  
   "_id":"ahokw88",
   "type":"Book",
   "title":"The AWK Programming Language",
   "year":"1988",
   "publisher":"Addison-Wesley",
   "authors":[  
      "Alfred V. Aho",
      "Brian W. Kernighan",
      "Peter J. Weinberger"
   ],
   "source":"DBLP"
}

示例查询

以下查询展示了如何使用 JSON_VALUE 在标题为“Probabilistic and Statistical Methods in Cryptology, An Introduction”的书籍中检索标量值（标题、出版商）：

SELECT
    JSON_VALUE(jsonContent, '$.title') AS title
  , JSON_VALUE(jsonContent, '$.publisher') as publisher
  , jsonContent
FROM OPENROWSET
  (
      BULK 'json/books/*.json',
      DATA_SOURCE = 'SqlOnDemandDemo'
    , FORMAT='CSV'
    , FIELDTERMINATOR ='0x0b'
    , FIELDQUOTE = '0x0b'
    , ROWTERMINATOR = '0x0b'
  )
WITH
  ( jsonContent varchar(8000) ) AS [r]
WHERE
  JSON_VALUE(jsonContent, '$.title') = 'Probabilistic and Statistical Methods in Cryptology, An Introduction'

重要

我们将整个 JSON 文件作为单行或列进行读取。因此，FIELDTERMINATOR、FIELDQUOTE 和 ROWTERMINATOR 设置为 0x0b，因为我们不希望在文件中找到它。

Last updated on 2025-04-23