CMU 15-721 16-服务器端的逻辑执行 Server -side Logic Execution

编程语言 2019-09-09 10:01:34 阅读次数: 0

今日议题

背景介绍
用户自定义函数的内联

背景介绍

数据库客户端API

目前我们假设所有的用户逻辑都在客户自己的应用中，然后通过客户端协议如JDBC/ODBC和数据库进行通信获取和存储数据，如下图：

嵌入式数据库逻辑

数据库允许将应用逻辑移植到数据库中减少网络通信的交互次数，这样的好处是高效和可重用。
将应用逻辑->

变为数据库逻辑->

用户自定义函数UDF

用户自定义函数（UDF）就是除了系统函数，内嵌在数据库中应用开发者自己写的函数，它可以输入标量参数，执行一些计算，返回一个结果（包括标量结果或者表结果）。

用户自定义函数UDF的优势

它可以鼓励模块化和代码重用，不同应用可以用同一逻辑实现，对于复杂操作很少的网络交互，某些类型的应用可以非常容易的用UDF表达或者读取。

用户自定义函数UDF的劣势

查询优化器是把UDF当成黑盒，因此，
→ 无法评估它的代价，由于UDF有相关查询在里面，因此很难并行。
→ 一些数据库不支持一个线程中执行带UDF的查询，在查询或者WHERE条件里面的复杂UDF，会强制数据库用迭代方式执行。
→ RBAR = "Row By Agonizing Row"，也就是严格程序化编码的结果，而不是基于集合的方式，比如循环中一行行和数据库进行交互。
→ 如果UDF里面调用的查询有隐性的Join而优化器无法得知，那样更糟糕。因为数据库执行UDF里的SQL都是一行一行的方式，所以那些跨多语句的优化方式无法被应用到。

UDF的性能

先看SQL Server做的一个实验

MICROSOFT SQL SERVER UDF的历史

2001 – Microsoft支持了TSQL标量UDFs.
2008 – 用户开始发现UDF是“恶魔”。
2010 – Microsoft发现UDF是“恶魔”。
2014 – UDF的去相关研究开始@IIT-B。
2015 – Froid项目在MSFT Jim Gray Lab开始。
2018 – Froid项目进入SQL Server 2019。

Froid项目

自动把UDF转换成关系型表达式，并且可以被内联为子查询。不需要应用程序员去修改UDF的代码，而是在数据库Rewrite阶段就进行转换，从而避免修改基于代价的优化器。商业数据库已经有能力去把这些规则有效的转换为子查询。

子查询重写

数据库本身就把在Where子句中的嵌套子查询当成一个带参数并返回单值或结果集的函数，因此有两种方法进行优化：
→ 去除相关性或者扁平化重写SQL
→ 分解嵌套子查询并存为临时表

LATERAL连接

一个带lateral的内子查询可以引用相关联表的那些行，从而决定是否将它们返回到最终输出。
→ 允许在FROM子句中加入子查询，而且在查询过程中每次迭代一行会评估该内子查询的有关联关系的表的每一行。
→ 内子查询返回的行可以被加入到与外查询Join完的最终结果集中。

FROID 概述

步骤 #1 – 变换语句

步骤 #2 – UDF分块

扫描二维码关注公众号，回复： 7237748 查看本文章

步骤 #3 – 合并表达式

步骤 #4 – 内联UDF到查询

步骤 #5 – 优化器优化

额外惊喜的优化

优化前

优化后

参考链接和文献：

猜你喜欢

转载自yq.aliyun.com/articles/717778

CMU 15-721 16-服务器端的逻辑执行 Server -side Logic Execution

CMU 15-721 15-查询执行和处理过程 Query Execution & Processing

CMU 15-721 14-数据库调度 Scheduling

服务器端包含SSI(Server Side Include)简介

pikachu-服务器端请求伪造SSRF(Server-Side Request Forgery)

SAP Spartacus 服务器端渲染(SSR，Server Side Rendering)专题

CMU15-445 2022 Fall 通关记录 —— Project 3：Query Execution（上篇）

SHTML(Server Side Include：服务端包含)

服务端渲染SSR（Server Side Rendering）

SQL Server的执行计划（Execution Plans）

React: Server-Side Rendering React服务器端渲染教程 Lynda课程中文字幕

Netty server/business logic 实现

Server side JVM GC 参数

服务器模板注入 SSTI （Server-side template injection）

逻辑回归（logic regression）

【时序逻辑】 Temporal Logic

CMU

Logic

移动端测试-appium（An unknown server-side error occurred while processing the command. Original error: ）

cmu 16-385 笔记

ssrf(Server-Side Request Forgery)

Java - Server-side Template Injection

SAP Server Side JavaScript解决方案

XVWA SSTI Server Side Template Injection

CMU15-445：Lab1缓冲池管理器

Logic Controller(逻辑控制器)

SQL Server 性能调优之执行计划（Execution Plan）调优

SQL Server execution plan with convert implicit 2

SQL Server execution plan with convert implicit

２。hbase CRUD--Put operation(server side)

今日推荐

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

周排行

阿里云短信服务平台注册

Windows下的字符串处理(1)

sqoop: mysql导入数据到hdfs, hive, hbase

commons.lang中常用的工具类

离线安装PostgreSQL11.6

使用PyTorch简单实现卷积神经网络模型

一文彻底搞定谱聚类

一道面试题引发的血案

One Chat for Mac(聊天工具)

TCP/IP的底层队列是如何实现的？

每日归档

更多

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)