cast
函数
适用于: Databricks SQL Databricks Runtime
将值 expr
强制转换为目标数据类型 type
。 此运算符是 ::(双冒号)运算符的同义词
语法
cast(sourceExpr AS targetType)
参数
sourceExpr
:任何可强制转换的表达式。targetType
:结果的数据类型。
返回
结果为类型 targetType
。
以下数据类型强制转换组合有效:
源(行)目标(列) | VOID | numeric | STRING | DATE | TIMESTAMP | TIMESTAMP_NTZ | year-month interval | day-time interval | BOOLEAN | BINARY | ARRAY | MAP | STRUCT | VARIANT | OBJECT |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
VOID | Y | Y | Y | Y | Y | Y | Y | Y | Y | Y | Y | Y | Y | Y | N |
numeric | N | Y | Y | N | Y | N | Y | Y | Y | N | N | N | N | Y | N |
STRING | N | Y | Y | Y | Y | Y | Y | Y | Y | Y | N | N | N | Y | N |
DATE | N | N | Y | Y | Y | Y | N | N | N | N | N | N | N | Y | N |
TIMESTAMP | N | Y | Y | Y | Y | Y | N | N | N | N | N | N | N | Y | N |
TIMESTAMP_NTZ | N | N | Y | Y | Y | Y | N | N | N | N | N | N | N | Y | N |
year-month interval | N | Y | Y | N | N | N | Y | N | N | N | N | N | N | N | N |
day-time interval | N | Y | Y | N | N | N | N | Y | N | N | N | N | N | N | N |
BOOLEAN | N | Y | Y | N | Y | N | N | N | Y | N | N | N | N | Y | N |
BINARY | N | Y | Y | N | N | N | N | N | N | Y | N | N | N | Y | N |
ARRAY | N | N | Y | N | N | N | N | N | N | N | Y | N | N | Y | N |
MAP | N | N | Y | N | N | N | N | N | N | N | N | Y | N | N | N |
STRUCT | N | N | Y | N | N | N | N | N | N | N | N | N | Y | N | N |
VARIANT | N | Y | Y | Y | Y | Y | N | N | Y | Y | Y | Y | Y | Y | N |
OBJECT | N | N | N | N | N | N | N | N | N | N | N | Y | Y | N | N |
基于 targetType 的规则和限制
警告
在 Databricks Runtime 中,如果 spark.sql.ansi.enabled 为 false
,则溢出不会导致错误,而是将结果“换行”。
对 targetType
使用格式无效或包含无效字符的 sourceExpr
值将导致 NULL
。
numeric
如果 targetType
是数字,而 sourceExpr
的类型为:
-
结果是指定数字类型的
NULL
。 -
如果
targetType
是整数,则结果将sourceExpr
截断为整数。否则,结果将进行
sourceExpr
舍入,以符合targetType
的适用标量。如果值超出
targetType
的范围,则引发溢出错误。使用 try_cast 将溢出错误转换为
NULL
。 -
sourceExpr
将读取为targetType
文本值。如果
sourceExpr
不符合文本值的格式,则会引发错误。如果值超出
targetType
的范围,则引发溢出错误。使用 try_cast 将溢出和无效格式错误转换为
NULL
。 -
结果是
1970-01-01 00:00:00 UTC
和sourceExpr
之间已消逝的秒数。如果
targetType
是整数,则结果将截断为整数。否则,结果将四舍五入以符合
targetType
的适用标量。如果结果超出
targetType
的范围,则引发溢出错误。使用 try_cast 将溢出错误转换为
NULL
。 -
适用于: Databricks SQL Databricks Runtime 11.3 LTS 及更高版本
目标类型必须是精确数值。
给定一个
INTERVAL upper_unit TO lower_unit
,以lower_unit
的总数来测量结果。 如果lower_unit
是SECOND
,则秒的小数形式存储在小数点右侧。 所有其他间隔的结果始终为整数。 -
如果
sourceExpr
为:true
:结果为 1。false
:结果为 0。NULL
:结果为NULL
。
-
VARIANT
类型的实际值类型的规则适用。
示例
> SELECT cast(NULL AS INT);
NULL
> SELECT cast(5.6 AS INT);
5
> SELECT cast(5.6 AS DECIMAL(2, 0));
6
> SELECT cast(-5.6 AS INT);
-5
> SELECT cast(-5.6 AS DECIMAL(2, 0));
-6
> SELECT cast(128 AS TINYINT);
Overflow
> SELECT cast(128 AS DECIMAL(2, 0));
Overflow
> SELECT cast('123' AS INT);
123
> SELECT cast('123.0' AS INT);
Invalid format
> SELECT cast(TIMESTAMP'1970-01-01 00:00:01' AS LONG);
1
> SELECT cast(TIMESTAMP'1970-01-01 00:00:00.000001' AS DOUBLE);
1.0E-6
> SELECT cast(TIMESTAMP'2022-02-01 00:00:00' AS SMALLINT);
error: overflow
> SELECT cast(true AS BOOLEAN);
1
> SELECT cast(INTERVAL '1-2' YEAR TO MONTH AS INTEGER);
14
> SELECT cast(INTERVAL '1:30.5' MINUTE TO SECOND AS DECIMAL(5, 2));
90.50
> SELECT cast(TRUE AS INT);
1
> SELECT cast(FALSE AS INT);
0
> SELECT cast('15'::VARIANT AS INT);
15
STRING
如果 targetType
是字符串类型并且 sourceExpr
的类型为:
-
结果是
NULL
字符串。 -
结果是带有可选减号且不带前导零(小数点左侧的单个数字除外)的文本数字。 如果
targetType
是DECIMAL(p, s)
且s
大于 0,则添加小数点并将尾部零相加以得出标量。 -
如果绝对数小于
10,000,000
且大于或等于0.001
,则结果不使用科学记数法表示,小数点两侧至少包含一位数。否则,Azure Databricks 使用尾数,后接
E
和一个指数。 尾数包含一个可选的前导减号,后接小数点左侧的一位数,以及右侧大于零的最小位数。 指数包含可选的前导减号。 -
如果年份介于公元前 9999 年和公元 9999 年之间,则结果分别为
-YYYY-MM-DD
和YYYY-MM-DD
格式的 dateString。对于此范围之前或之后的年份,将必要的位数添加到年份组成部分,
+
用于表示“公元”。 -
如果年份介于公元前 9999 年和公元 9999 年之间,则结果分别为
-YYYY-MM-DD hh:mm:ss
和YYYY-MM-DD hh:mm:ss
格式的 timestampString。对于此范围之前或之后的年份,将必要的位数添加到年份组成部分,
+
用于表示“公元”。根据需要添加小数秒
.f...
。 -
如果年份介于公元前 9999 年和公元 9999 年之间,则结果分别为
-YYYY-MM-DD hh:mm:ss
和YYYY-MM-DD hh:mm:ss
格式的 timestampString。对于此范围之前或之后的年份,将必要的位数添加到年份组成部分,
+
用于表示“公元”。根据需要添加小数秒
.f...
。 -
结果是间隔文本的最短表示形式。 如果间隔为负数,则在
interval-string
中嵌入符号。 对于小于 10 的单位,将省略前导零。典型的年月间隔字符串采用以下格式:
INTERVAL 'Y' YEAR
INTERVAL 'Y-M' YEAR TO MONTH
INTERVAL 'M' MONTH
-
结果是间隔文本的最短表示形式。 如果间隔为负数,则在
interval-string
中嵌入符号。 对于小于 10 的单位,将省略前导零。典型的日期时间间隔字符串采用以下格式:
INTERVAL 'D' DAY
INTERVAL 'D h' DAY TO HOUR
INTERVAL 'D h:m' DAY TO MINUTE
INTERVAL 'D h:m:s' DAY TO SECOND
INTERVAL 'h' HOUR
INTERVAL 'h:m' HOUR TO MINUTE
INTERVAL 'm:s' MINUTE TO SECOND
INTERVAL 's' SECOND
-
true
布尔值的结果是STRING
文本true
。 如果布尔值为false
,则结果为字符串字面量false
。 如果布尔值为NULL
,则结果为 NULL 字符串。 -
结果是解释为 UTF-8 字符序列的二进制
sourceExpr
。Azure Databricks 不验证 UTF-8 字符。 从
BINARY
到STRING
的强制转换永远不会注入替代字符或引发错误。 -
结果是逗号分隔的强制转换元素列表,括在方括号
[ ]
中。 每个逗号后接一个空格。NULL
元素转换为文本null
。Azure Databricks 不会用引号括住或以其他方式标记单个元素,这些元素本身可以包含括号或逗号。
-
结果是逗号分隔的强制转换键值对列表,括在大括号
{ }
中。 每个逗号后接一个空格。 每个键值对由->
分隔。NULL
映射值转换为文本null
。Azure Databricks 不会用引号括住或以其他方式标记单个键或值,这些键或值本身可以包含大括号、逗号或
->
。 -
结果是逗号分隔的强制转换字段值列表,括在大括号
{ }
中。 每个逗号后接一个空格。NULL
字段值转换为文本null
。Azure Databricks 不会用引号括住或以其他方式标记单个字段值,这些值本身可以包含大括号或逗号。
-
VARIANT
类型的实际值类型的规则适用。
示例
> SELECT cast(NULL AS STRING);
NULL
> SELECT cast(-3Y AS STRING);
-3
> SELECT cast(5::DECIMAL(10, 5) AS STRING);
5.00000
> SELECT cast(12345678e-4 AS STRING);
1234.5678
> SELECT cast(1e7 as string);
1.0E7
> SELECT cast(1e6 as string);
1000000.0
> SELECT cast(1e-4 as string);
1.0E-4
> SELECT cast(1e-3 as string);
0.001
> SELECT cast(12345678e7 AS STRING);
1.2345678E14
> SELECT cast(DATE'1900-12-31' AS STRING);
1900-12-31
-- Caesar no more
> SELECT cast(DATE'-0044-03-15' AS STRING);
-0044-03-15
> SELECT cast(DATE'100000-12-31' AS STRING);
+100000-12-31
> SELECT cast(current_timestamp() AS STRING);
2022-04-02 22:29:09.783
> SELECT cast(TIMESTAMP_NTZ'2023-01-01' AS STRING);
2023-01-01 00:00:00
> SELECT cast(INTERVAL -'13-02' YEAR TO MONTH AS STRING);
INTERVAL '-13-2' YEAR TO MONTH
> SELECT cast(INTERVAL '12:04.9900' MINUTE TO SECOND AS STRING);
INTERVAL '12:04.99' MINUTE TO SECOND
> SELECT cast(true AS STRING);
true
> SELECT cast(false AS STRING);
false
-- A bad UTF-8 string
> SELECT cast(x'33800033' AS STRING);
3�3
> SELECT hex(cast(x'33800033' AS STRING));
33800033
> SELECT cast(array('hello', NULL, 'world') AS STRING);
[hello, null, world]
> SELECT cast(array('hello', 'wor, ld') AS STRING);
[hello, wor, ld]
> SELECT cast(array() AS STRING);
[]
> SELECT cast(map('hello', 1, 'world', null) AS STRING);
{hello -> 1, world -> null}
> SELECT cast(map('hello -> 1', DATE'2022-01-01') AS STRING);
{hello -> 1 -> 2022-01-01}
> SELECT cast(map() AS STRING);
{}
> SELECT cast(named_struct('a', 5, 'b', 6, 'c', NULL) AS STRING);
{5, 6, null}
> SELECT cast(named_struct() AS STRING);
{}
> SELECT cast(DATE'2024-01-05'::VARIANT AS STRING);
2024-01-05
DATE
如果 targetType
是日期类型并且 sourceExpr
的类型为:
-
结果是
NULL
DATE
。 -
sourceExpr
必须是有效的 dateString。如果
sourceExpr
不是有效的dateString
,则 Azure Databricks 会返回错误。使用 try_cast 将无效数据错误转换为
NULL
。 -
结果是时间戳
sourceExpr
的日期部分。 -
结果是 timestamp_ntz
sourceExpr
的日期部分。 -
VARIANT
数据类型保留的实际值的类型规则适用。
示例
> SELECT cast(NULL AS DATE);
NULL
> SELECT cast('1900-10-01' AS DATE);
1900-10-01
> SELECT cast('1900-10-01' AS DATE);
1900-10-01
-- There is no February 30.
> SELECT cast('1900-02-30' AS DATE);
Error
> SELECT cast(TIMESTAMP'1900-10-01 12:13:14' AS DATE);
1900-10-01
> SELECT cast(TIMESTAMP_NTZ'1900-10-01 12:13:14' AS DATE);
1900-10-01
> SELECT cast(TIMESTAMP_NTZ'1900-10-01 12:13:14'::VARIANT AS DATE);
1900-10-01
TIMESTAMP
如果 targetType
是时间戳类型并且 sourceExpr
的类型为:
-
结果是
NULL
DATE
。 -
sourceExpr
读取为自1970-01-01 00:00:00 UTC
以来经过的秒数。小于微秒的小数部分将被截断。
如果值超出
TIMESTAMP
的范围,则引发溢出错误。使用 try_cast 将溢出错误转换为
NULL
。 -
sourceExpr
必须是有效的 timestampString。如果
sourceExpr
不是有效的timestampString
,则 Azure Databricks 会返回错误。使用 try_cast 将无效数据错误转换为
NULL
。 DATE
在
00:00:00
(小时)的结果是sourceExpr
DATE
。
结果是一个时间戳值,其中包含与 timestamp_ntz sourceExpr
相同的年/月/日/小时/分钟/秒字段。
-
VARIANT
数据类型保留的实际值的类型规则适用。
示例
> SELECT cast(NULL AS TIMESTAMP);
NULL
> SET TIME ZONE '+00:00';
> SELECT cast(0.0 AS TIMESTAMP);
1970-01-01 00:00:00
> SELECT cast(0.0000009 AS TIMESTAMP);
1970-01-01 00:00:00
> SELECT cast(1e20 AS TIMESTAMP);
Error: overflow
> SELECT cast('1900' AS TIMESTAMP);
1900-01-01 00:00:00
> SELECT cast('1900-10-01 12:13:14' AS TIMESTAMP);
1900-10-01 12:13:14
> SELECT cast('1900-02-30 12:13:14' AS TIMESTAMP);
Error
> SELECT cast(DATE'1900-10-01' AS TIMESTAMP);
1900-10-01 00:00:00
> SELECT cast(TIMESTAMP_NTZ'2023-01-01 02:03:04.567' as TIMESTAMP)
2023-01-01 02:03:04.567
> SELECT cast(DATE'1900-10-01'::VARIANT AS TIMESTAMP);
1900-10-01 00:00:00
TIMESTAMP_NTZ
如果 targetType
是 TIMESTAMP_NTZ 类型,并且 sourceExpr
的类型为:
-
结果是
NULL
DATE
。 -
sourceExpr
必须是有效的 timestampString。如果
sourceExpr
不是有效的timestampString
,则 Azure Databricks 会返回错误。使用 try_cast 将无效数据错误转换为
NULL
。 -
结果是
00:00:00
小时后所处的sourceExpr
日期。 -
结果是本地时间,其表示形式与会话时区中的
sourceExpr
相同。 -
VARIANT
数据类型保留的实际值的类型规则适用。
示例
> SELECT cast(NULL AS TIMESTAMP_NTZ);
NULL
> SELECT cast('1900' AS TIMESTAMP_NTZ);
1900-01-01 00:00:00
> SELECT cast('1900-10-01 12:13:14' AS TIMESTAMP_NTZ);
1900-10-01 12:13:14
> SELECT cast('1900-02-30 12:13:14' AS TIMESTAMP_NTZ);
Error
> SELECT cast(DATE'1900-10-01' AS TIMESTAMP_NTZ);
1900-10-01 00:00:00
> SELECT current_timezone(), CAST(TIMESTAMP'2021-7-1T8:43:28' as TIMESTAMP_NTZ);
America/Los_Angeles 2021-07-01 08:43:28
> SELECT current_timezone(), CAST(TIMESTAMP'2021-7-1T8:43:28UTC+3' as TIMESTAMP_NTZ);
America/Los_Angeles 2021-06-30 22:43:28
> SELECT cast(DATE'1900-10-01'::VARIANT AS TIMESTAMP_NTZ);
1900-10-01 00:00:00
year-month interval
如果 targetType
是年月间隔并且 sourceExpr
的类型为:
-
结果是
NULL
的年月间隔。 -
适用于: Databricks SQL Databricks Runtime 11.3 LTS 及更高版本
该数值解释为
targetType
yearmonthIntervalQualifier 的低单位数。 -
sourceExpr
必须是有效的 yearMonthIntervalString。如果
sourceExpr
不是有效的yearMonthIntervalString
,则 Azure Databricks 会返回错误。使用 try_cast 将无效数据错误转换为
NULL
。 -
如果
targetType
yearMonthIntervalQualifier 包含MONTH
,则值保持不变,但被重新解释以匹配目标类型。否则,如果源类型 yearMonthIntervalQualifier 包含
MONTH
,则结果将被截断为完整年份。
示例
> SELECT cast(NULL AS INTERVAL YEAR);
NULL
> SELECT cast('1-4' AS INTERVAL YEAR TO MONTH)::STRING;
INTERVAL '1-4' YEAR TO MONTH
> SELECT cast('1' AS INTERVAL YEAR TO MONTH);
error
> SELECT cast(INTERVAL '1-4' YEAR TO MONTH AS INTERVAL MONTH)::STRING;
INTERVAL '16' MONTH
> SELECT cast(14 AS INTERVAL YEAR TO MONTH)::STRING;
INTERVAL '1-2' YEAR TO MONTH
> SELECT cast(INTERVAL '1-11' YEAR TO MONTH AS INTERVAL YEAR)::STRING;
INTERVAL '1' YEAR
day-time interval
如果 targetType
是日期时间间隔并且 sourceExpr
的类型为:
-
结果是
NULL
的日期时间间隔。 -
适用于: Databricks SQL Databricks Runtime 11.3 LTS 及更高版本
该数值解释为
targetType
dayTimeIntervalQualifier 的低单位数。 如果单位是SECOND
,任何小数将解释为秒的小数形式。 -
sourceExpr
必须是有效的 dayTimeIntervalString。如果
sourceExpr
不是有效的dayTimeIntervalString
,则 Azure Databricks 会返回错误。使用 try_cast 将无效数据错误转换为
NULL
。 -
如果
targetType
dayTimeIntervalQualifier 包含源类型 dayTimeIntervalQualifier 的最小单位,则值保持不变,但被重新解释以匹配目标类型。否则,将截断
sourceExpr
间隔以适合targetType
。
> SELECT cast(NULL AS INTERVAL HOUR);
NULL
> SELECT cast('1 4:23' AS INTERVAL DAY TO MINUTE)::STRING;
INTERVAL '1 04:23' DAY TO MINUTE
> SELECT cast('1' AS INTERVAL DAY TO MINUTE);
error
> SELECT cast(INTERVAL '1 4:23' DAY TO MINUTE AS INTERVAL MINUTE)::STRING;
INTERVAL '1703' MINUTE
> SELECT cast(INTERVAL '1 4:23' DAY TO MINUTE AS INTERVAL HOUR)::STRING;
INTERVAL '28' HOUR
> SELECT cast(125.3 AS INTERVAL MINUTE TO SECOND)::STRING;
INTERVAL '2:5.3' MINUTE TO SECOND
BOOLEAN
如果 targetType
是布尔值并且 sourceExpr
的类型为:
-
结果是类型
BOOLEAN
为NULL
。 -
如果
sourceExpr
为:0
:结果为false
。NULL
:结果为NULL
。special floating point value
:结果为true
。
否则,结果为
true
。
-
如果
sourcEexpr
是(不区分大小写):'T', 'TRUE', 'Y', 'YES', or '1'
:结果为true
'F', 'FALSE', 'N', 'NO', or '0'
:结果为false
NULL
:结果为NULL
否则,Azure Databricks 将为类型布尔值错误返回无效的输入语法。
使用 try_cast 将无效数据错误转换为
NULL
。 -
VARIANT
类型的实际值类型的规则适用。
示例
> SELECT cast(NULL AS BOOLEAN);
NULL
> SELECT cast('T' AS BOOLEAN);
true
> SELECT cast('True' AS BOOLEAN);
true
> SELECT cast('1' AS BOOLEAN);
true
> SELECT cast('0' AS BOOLEAN);
false
> SELECT cast('n' AS BOOLEAN);
false
> SELECT cast('on' AS BOOLEAN);
error: invalid input syntax for type boolean
> SELECT cast(0 AS BOOLEAN);
false
> SELECT cast(0.0E10 AS BOOLEAN);
false
> SELECT cast(1 AS BOOLEAN);
true
> SELECT cast(0.1 AS BOOLEAN);
true
> SELECT cast('NaN'::FLOAT AS BOOLEAN);
true
> SELECT cast(1::VARIANT AS BOOLEAN);
true
BINARY
如果 targetType
是二进制值并且 sourceExpr
的类型为:
示例
> SELECT cast(NULL AS BINARY);
NULL
> SELECT hex(cast('Spark SQL' AS BINARY));
537061726B2053514C
> SELECT hex(cast('Oдesa' AS BINARY));
4FD0B4657361
> SELECT hex(cast('Oдesa'::VARIANT AS BINARY));
4FD0B4657361
ARRAY
如果 targetType
是 ARRAY <> 并且 sourceExpr
的类型为:
-
结果是
targeType
的NULL
。 -
如果支持从
sourceElementType
到targetElementType
的强制转换,则结果是ARRAY<targetElementType>
,其中的所有元素已强制转换为targetElementType
。如果不支持强制转换或无法强制转换任一元素,则 Azure Databricks 会引发错误。
使用 try_cast 将无效数据或溢出错误转换为
NULL
。 -
VARIANT
数据类型保留的实际值的类型规则适用。
示例
> SELECT cast(NULL AS ARRAY<INT>);
NULL
> SELECT cast(array('t', 'f', NULL) AS ARRAY<BOOLEAN>);
[true, false, NULL]
> SELECT cast(array('t', 'f', NULL) AS INTERVAL YEAR);
error: cannot cast array<string> to interval year
> SELECT cast(array('t', 'f', 'o') AS ARRAY<BOOLEAN>);
error: invalid input syntax for type boolean: o.
> SELECT cast(array('t', 'f', NULL)::VARIANT AS ARRAY<BOOLEAN>);
[true, false, NULL]
MAP
如果 targetType
是 MAP <targetKeyType, targetValueType>并且 sourceExpr
的类型为:
-
结果是
targetType
的NULL
。 MAP <sourceKeyType, sourceValueType>
如果支持从
sourceKeyType
到targetKeyType
以及从sourceValueType
到targetValueType
的强制转换,则结果是MAP<targetKeyType, targetValueType>
,其中的所有键已强制转换为targetKeyType
,所有值已强制转换为targetValueType
。如果不支持强制转换或无法强制转换任一键或值,则 Azure Databricks 会引发错误。
使用 try_cast 将无效数据或溢出错误转换为
NULL
。-
VARIANT
数据类型保留的实际值的类型规则适用。 OBJECT < [sourceFieldName : sourceFieldType [, …]] >
STRING
类型的每个sourceFieldName
都强制转换为targetKeyType
并映射到一个映射键。sourceFieldType
的每个源字段值都强制转换为targetValueType
并映射到各自的映射值。如果不支持任何转换,或者无法转换任何字段值或键值,Azure Databricks 会引发错误。
使用 try_cast 将无效数据或溢出错误转换为
NULL
。
示例
> SELECT cast(NULL AS MAP<STRING, INT>);
NULL
> SELECT cast(map('10', 't', '15', 'f', '20', NULL) AS MAP<INT, BOOLEAN>);
{10 -> true, 15 -> false, 20 -> null}
> SELECT cast(map('10', 't', '15', 'f', '20', NULL) AS MAP<INT, ARRAY<INT>>);
error: cannot cast map<string,string> to map<int,array<int>>
> SELECT cast(map('10', 't', '15', 'f', '20', 'o') AS MAP<INT, BOOLEAN>);
error: invalid input syntax for type boolean: o.
-- Casting an OBJECT to a MAP
> SELECT schema_of_variant(parse_json('{"cars": 12, "bicycles": 5 }'));
OBJECT<bicycles: BIGINT, cars: BIGINT>
> SELECT CAST(parse_json('{"cars": 12, "bicycles": 5 }') AS MAP<STRING, INTEGER>);
{bicycles -> 5, cars -> 12}
STRUCT
如果 targetType
是 STRUCT <[targetFieldName : targetFieldType [NOT NULL] [COMMENT str] [, …]] > 并且 sourceExpr
的类型为:
-
结果是
targetType
的NULL
。 STRUCT < [sourceFieldName : sourceFieldType [NOT NULL] [COMMENT str] [, …]] >
如果满足以下所有条件,则
sourceExpr
可以强制转换为targetType
:- 源类型与目标具有相同数量的字段
- 对于所有字段:
sourceFieldTypeN
可以强制转换为targetFieldTypeN
。 - 对于所有字段值:源字段值 N 可以强制转换为
targetFieldTypeN
,如果目标字段 N 标记为NOT NULL
,则值不为 null。
sourceFieldName
、源NOT NULL
约束和源COMMENT
不需要与targetType
匹配,且将被忽略。如果不支持转换或无法转换任一字段,则 Azure Databricks 会引发错误。
使用 try_cast 将无效数据或溢出错误转换为
NULL
。-
VARIANT
数据类型保留的实际值的类型规则适用。 OBJECT < [sourceFieldName : sourceFieldType [, …]] >
所有
sourceFieldName
都与sourceFieldName
匹配。sourceFieldType
的每个源字段值都强制转换为匹配的targetValueType
并映射到各自的映射值。如果
targetFieldName
不匹配,则字段值为NULL
。如果
sourceFieldName
不匹配,则忽略该字段。如果不支持任何转换,或者无法转换任何字段值或键值,Azure Databricks 会引发错误。
使用 try_cast 将无效数据或溢出错误转换为
NULL
。
示例
> SELECT cast(NULL AS STRUCT<a:INT>);
NULL
> SELECT cast(named_struct('a', 't', 'b', '1900-01-01') AS STRUCT<b:BOOLEAN, c:DATE NOT NULL COMMENT 'Hello'>);
{"b":true,"c":1900-01-01}
> SELECT cast(named_struct('a', 't', 'b', NULL::DATE) AS STRUCT<b:BOOLEAN, c:DATE NOT NULL COMMENT 'Hello'>);
error: cannot cast struct<a:string,b:date> to struct<b:boolean,c:date>
> SELECT cast(named_struct('a', 't', 'b', '1900') AS STRUCT<b:BOOLEAN, c:ARRAY<INT>>);
error: cannot cast struct<a:string,b:string> to struct<b:boolean,c:array<int>>
> SELECT cast(named_struct('a', 't', 'b', 'hello') AS STRUCT<b:BOOLEAN, c:DATE>);
error: Cannot cast hello to DateType
> SELECT cast(named_struct('a', 't', 'b', '1900-01-01')::VARIANT AS STRUCT<b:BOOLEAN, c:DATE NOT NULL COMMENT 'Hello'>);
{"b":true,"c":1900-01-01}
-- Casting an OBJECT to a STRUCT
> SELECT schema_of_variant(parse_json('{"name": "jason", "age": 25 }'));
OBJECT<age: BIGINT, name: STRING>
> SELECT CAST(parse_json('{"name": "jason", "age": 25 }') AS STRUCT<id: BIGINT, name: STRING>);
{"id":null,"name":"jason"}
VARIANT
如果 targetType
是一个 VARIANT 并且 sourceExpr
的类型为:
-
结果是类型
VARIANT
为NULL
。 -
此结果是
VARIANT
,表示数值。DECIMAL
类型的精度必须 <= 38。所有整型数值都映射到
BIGINT
。所有
DECIMAL
值都映射到其最小精度和小数位数。 -
此结果是表示
STRING
值的VARIANT
。 DATE
此结果是表示
DATE
值的VARIANT
。-
此结果是表示
TIMESTAMP
值的VARIANT
。 -
此结果是表示
TIMESTAMP NTZ
值的VARIANT
。 -
此结果是表示
BOOLEAN
值的VARIANT
。 -
此结果是表示
BINARY
值的VARIANT
。 -
如果支持从
sourceElementType
强制转换为VARIANT
,则结果为VARIANT
,表示ARRAY<sourceElementType>
。如果不支持转换,Azure Databricks 会引发错误。
使用 try_cast 将无效数据或溢出错误转换为
NULL
。
示例
> SELECT cast(NULL AS VARIANT);
NULL
> SELECT cast(5.1000 AS VARIANT);
5.1
> SELECT schema_of_variant(cast(5 AS VARIANT));
BIGINT