Spark优化包含non deterministic Filter的条件下推

其他 2021-11-19 09:59:39 阅读次数: 0

优化代码

优化代码，参考: CombineFilters Rule

val applyLocally: PartialFunction[LogicalPlan, LogicalPlan] = {
    
    
    // The query execution/optimization does not guarantee the expressions are evaluated in order.
    // We only can combine them if and only if both are deterministic.
    case Filter(fc, nf @ Filter(nc, grandChild)) if nc.deterministic =>
      val (combineCandidates, nonDeterministic) =
        splitConjunctivePredicates(fc).partition(_.deterministic)
      val mergedFilter = (ExpressionSet(combineCandidates) --
        ExpressionSet(splitConjunctivePredicates(nc))).reduceOption(And) match {
    
    
        case Some(ac) =>
          Filter(And(nc, ac), grandChild)
        case None =>
          nf
      }
      nonDeterministic.reduceOption(And).map(c => Filter(c, mergedFilter)).getOrElse(mergedFilter)
  }

实现原理

两个相邻的Filter，拆解出上层Filter中的deterministic的expresses，然后合并到下层的Filter中

Demo

优化前

Filter ((a#0 = 7) AND (rand(10) > 0.1))
+- Filter NOT a#0 IN (1,3,5)
   +- LocalRelation <empty>, [a#0, b#1, c#2]

优化后

Filter (rand(10) > 0.1)
+- Filter (NOT a#0 IN (1,3,5) AND (a#0 = 7))
   +- LocalRelation <empty>, [a#0, b#1, c#2]

猜你喜欢

转载自blog.csdn.net/wankunde/article/details/116717997

Spark优化包含non deterministic Filter的条件下推

MySQL 索引条件下推优化

MySQL查询优化之索引条件下推

8.MySQL8.0索引条件下推优化（ICP）

MySQL · 性能优化 · 子查询条件下推到物化表

MySQL 索引条件下推

浅析MySQL中的Index Condition Pushdown (ICP 索引条件下推)和Multi-Range Read（MRR 索引多范围查找）查询优化

MySQL索引条件下推的简单测试

NP完全问题 Non-deterministic Polynomial 多项式复杂程度的非确定问题

Spark Filter算子在Parquet文件上的下推

实现一个非确定性下推自动机（DPDA - Deterministic PushDown Automaton）

关于oracle 函数的Deterministic

Deterministic builds with clang and lld

MySQL (ICP) 索引条件下推对比Oracle进行说明

神奇的 SQL 之 ICP → 索引条件下推

Deep Deterministic Policy Gradient（DDPG）

最优化-约束条件下的最优化方法

MySQL5.6之Index Condition Pushdown(ICP,索引条件下推)

一起学习Mysql索引三（ICP,索引条件下推）

【MySQL】索引原理（三）：联合索引（最左前缀原则），覆盖索引，索引条件下推

flink sql （jdbc）如何支持where 条件下推数据库

Mysql的索引条件下推是怎么回事？有什么用？理论篇

MySQL ERROR:This function has none of DETERMINISTIC, NO SQL

文献笔记:Deterministic Policy Gradient Algorithms

BGP deterministic-med & compare-med

【pytorch】torch.backends.cudnn.deterministic

Deterministic Execution in 《Guidelines for using Adaptive Platform interfaces》

deterministic=True requires SQLite 3.8.3 or higher

[Unity] Deterministic compilation failed. You can disable Deterministic builds in Player Settings Li

Unity出现Deterministic compilation failed. You can disable Deterministic builds in Player Settings报错解决

今日推荐

Linus “吃狗粮”最积极！

开源日报 | Winamp播放器即将开源；生成式AI之战升级第二轮；Linus“吃狗粮”最积极；AI进入泡沫前期；吴泳铭为阿里云带来了什么？

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

周排行

SVN服务端安装在阿里云

实战 | 相机标定

webpack核心概念

note20——》只要肯低头吃苦，人生就会有救

PAT甲级 1062 Talent and Virtue （25 分）排序

NG Toolset开发笔记--5GNR Resource Grid（26）

如何对待上司

oracle命令

第9章 STL迭代器

logstash使用es映射模板

每日归档

更多

2024-05-20(36)

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)