查询筛选器

借助查询筛选器,你能够以交互方式减少在可视化效果中显示的数据量。 查询筛选器与查询参数类似,但有一些关键区别。 查询筛选器在执行查询后限制数据。 这使得筛选器非常适合较小的数据集以及查询执行很耗时、速率受限或成本高昂的环境。

下方介绍了 Databricks SQL 的一些优势。

  • 以前的查询筛选器仅在客户端运行,但这些更新后的筛选器在客户端或服务器端动态运行,以优化性能。
  • 简化的 UI 体验:单击“+添加筛选器”按钮并选择下拉列表中的列来添加筛选器。 无需创作、许可和刷新独立查询即可筛选列的不同值。
  • 启用“突出显示相关值”,查看筛选器中的哪些选择将返回给定其他筛选器选择的结果。 以同时使用“州/省/市/自治区”和“城市”筛选器的用户为例。 如果用户选择突出显示相关值,则在“州/省/市/自治区”筛选器中选择“加利福尼亚”将仅突出显示“城市”筛选器中的加利福尼亚的城市。 未突出显示的选项位于下拉菜单中的“已筛出”菜单选项下。
  • 文本输入筛选器:根据文本输入搜索筛选列结果。 可以通过三种模式查找搜索的匹配项:“完全匹配”、“包含”和“开头为”。
  • 使用快速日期选择器可以筛选预定义的日期范围,例如上周、上个月、去年等。
  • 可以在创建日期筛选器时设置默认日期范围。
  • 还可在仪表板上使用查询筛选器。 默认情况下,筛选器小组件会出现在已将筛选器添加到查询的每个可视化效果的旁边。 若要将筛选器小组件链接到仪表板级别查询筛选器,请参阅仪表板筛选器

功能说明

运行查询后,在“结果”面板中单击 +,然后选择“筛选”。

“+添加筛选器”按钮打开一个弹出菜单,在其中可应用以下筛选器和设置。

  • 列:应用筛选器的列。
    • 当前支持字符串、数字和日期。
    • 如果所选列包含日期,用户可以选择按日期、月份或年份指定时间分箱。
  • 类型:要应用的筛选器类型
    • 单选:仅筛选为一个字段值
    • 多选:筛选为多个字段值
    • 文本输入:输入字符串以搜索特定列中的匹配值。 支持“包含”、“精确匹配”和“开头为”
    • 日期/时间选取器和范围选取器:能够选择日期或日期范围以筛选日期数据类型
  • 排序顺序:筛选器下拉列表中值的排序顺序。 可以选择“升序”或“降序”。
  • 突出显示相关值 (y/n):启用此选项可轻松查看筛选器中的哪些选择将返回给定其他筛选器选择的结果。 以同时使用“州/省/市/自治区”和“城市”筛选器的用户为例。 如果用户选择突出显示相关值,则在“州/省/市/自治区”筛选器中选择“加利福尼亚”将突出显示“城市”筛选器中提供的选项集,以仅显示加利福尼亚的城市,而未突出显示的选项将位于下拉菜单中的“已筛出”菜单选项下。 请注意,这需要在每次更新筛选器时运行查询。
  • 默认值:选择“日期”类型列并选择时间分箱值(日、月或年)后,用户还可以选择为筛选器设置默认日期范围。 每当刷新查询时,都会自动应用默认筛选器。

限制

  • 请务必注意,查询筛选器适用于整个数据集。 但是,查询筛选器的下拉选择器仅限于 64k 唯一值。 如果用户希望在超过 64k 唯一筛选器值的情况下进行筛选,则建议改用 Text 参数。
  • 筛选器只能应用于查询返回的列,不能应用于引用表的所有列。
  • 筛选器在返回的结果中显示来自指定列的不同选项列表。 如果结果受到限制(即,使用“限制为 1000”的查询运行),则筛选器仅显示这 1000 个结果中的独一无二的值。
  • 尽管应用于查询的筛选器将进行优化来在客户端或服务器端运行,以获得更好的性能,但应用于仪表板的筛选器将始终在服务器端运行。