isin

检查列值是否位于值列表中。

Syntax

isin(*cols)

参数

参数 类型 Description
cols values 要检查的值列表

退货

列(布尔值)

示例

示例 1:筛选具有指定值中名称的行。

df = spark.createDataFrame([(2, "Alice"), (5, "Bob"), (8, "Mike")], ["age", "name"])
df[df.name.isin("Bob", "Mike")].orderBy("age").show()
# +---+----+
# |age|name|
# +---+----+
# |  5| Bob|
# |  8|Mike|
# +---+----+

示例 2:筛选具有指定列表中的年龄的行。

df[df.age.isin([1, 2, 3])].show()
# +---+-----+
# |age| name|
# +---+-----+
# |  2|Alice|
# +---+-----+

示例 3:筛选名称不在指定值中的行。

df[~df.name.isin("Alice", "Bob")].show()
# +---+----+
# |age|name|
# +---+----+
# |  8|Mike|
# +---+----+

示例 4:使用数据帧作为 IN 子查询。

df.where(df.age.isin(spark.range(6))).orderBy("age").show()
# +---+-----+
# |age| name|
# +---+-----+
# |  2|Alice|
# |  5|  Bob|
# +---+-----+