Postgresql中函数详解看一篇就够了——常用函数以及使用方法

文章目录

写在前面，当我们在用postgresql数据库进行数据取数时，难免会遇到一些数据处理上的场景，本文会针对一些常用的内置函数进行总结。

-- 查看postgresql的版本(以下任一语句都可以实现)
select version();
show server_version;

1.格式转换

1.1 格式转换符显示转换

利用双冒号可以直接进行格式转换，语法如下：
字段名或数值::数据类型
例子如下：

-- 将文本'123'转为int8类型
SELECT
    '123' :: int8 num;
-- 将文本类型字段t1转为int8类型
SELECT
    t1 :: int8 
    from temp;

1.2 利用数据类型显示转换

利用数据类型进行转换，语法如下：
数据类型数值
例子：

-- 将文本'123'转为int8类型
SELECT
    int8'123' num;

1.3 格式转换函数显示转换

利用数据转换函数cast进行转换，语法如下：
cast(字段名或数值 as 数据类型)
例子：

-- 将文本'123'转为int8类型
SELECT
    cast('123' as int4) num;
-- 将文本字段t1转为int类型
SELECT CAST( t1 AS INT ) t1_c 
FROM
    TEMP;

1.4 转换案例

-- 文本转整数
SELECT CAST
    ( '123' AS int4 );
-- 文本转浮点数字
SELECT CAST
    ( '123.34' AS DECIMAL );
SELECT CAST
    ( '123.34' AS NUMERIC );
-- 数字转文本
SELECT CAST
    ( 123 AS VARCHAR );--可变字符串
SELECT CAST
    ( - 123 AS CHAR ( 2 ) );-- 固定字符串，进行截断，将-123转为'-1'
SELECT CAST
    ( - 123 AS CHAR ( 6 ) );-- 固定字符串，进行空格填充，将-123转为'-123  '
SELECT CAST
    ( 124.94 AS TEXT );--可变字符串,将124.94转为'124.94'
SELECT
    to_char( 124.94, '999D9' );--将124.94转为'124.9',遵循四舍五入
SELECT
    to_char( 124.94, 'FM999.99' );--将124.94转为'124.94'
SELECT
    to_char( - 124.94, 'FM9999999.99' );--将-124.94转为'-124.94'
SELECT
    to_char( - 124.94, 'FM9999999.990' );--将-124.94转为'-124.940'
SELECT
    to_char( 124, '00000' );--左端用零补齐凑够5位，将124转为'00124'
SELECT
    to_char( 124, '99999' );--左端用空格补齐凑够5位，将124转为'  124'
SELECT
    to_char( - 124.945, 'FM999' );--只显示整数部分，遵循四舍五入
-- 时间戳(timestamp)转日期(date)
SELECT CAST
    ( now( ) AS DATE );--普通日期模式
-- 时间戳(timestamp)转文本
SELECT CAST
    ( now( ) AS TEXT );--不指定输出格式
SELECT
    to_char( now( ), 'yyyy-mm-dd' );--指定输出格式;
-- 文本转日期(date)
SELECT
    to_date( '2012-01-01', 'yyyy-mm-dd' );
-- 文本转时间戳(TIMESTAMP)
SELECT
    to_timestamp( '2012-01-01 12:02:01', 'yyyy-mm-dd HH24:MI:SS' );

2.数学计算

2.1 数学运算操作符

操作符	描述	例子	结果
+	加	2 + 3	5
-	减	2 - 3	-1
*	乘	2 * 3	6
/	除（整数除法截断结果）	4 / 2	2
%	模（取余）	5 % 4	1
^	指数（从左至右结合）	2.0 ^ 3.0	8
\|/	平方根	\|/ 25.0	5
\|\|/	立方根	\|\|/ 27.0	3
!	阶乘	5 !	120
!!	阶乘（前缀操作符）	!! 5	120
@	绝对值	@ -5.0	5
&	按位与	91 & 15	11
\|	按位或	32	3
#	按位异或	17 # 5	20
~	按位求反	~1	-2
<<	按位左移	1 << 4	16
>>	按位右移	8 >> 2	2

2.2 数学运算函数

函数	返回类型	描述	例子	结果
abs(x)	和输入相同	绝对值	abs(-12.43)	12.43
cbrt(dp)	double	立方根	cbrt(27.0)	3
ceil(dp or numeric)	和输入相同	不小于参数的最近的整数	ceil(-42.8)	-42
ceiling(dp or numeric)	和输入相同	不小于参数的最近的整数（ceil的别名）	ceiling(-95.3)	-95
degrees(dp)	dp	把弧度转为角度	degrees(0.5)	28.6478897565412
div(y numeric, x numeric)	numeric	y/x的整数商	div(9,4)	2
exp(dp or numeric)	和输入相同	指数	exp(1.0)	2.71828182845905
floor(dp or numeric)	和输入相同	不大于参数的最近的整数	floor(-42.8)	-43
ln(dp or numeric)	和输入相同	自然对数	ln(2.0)	0.693147180559945
log(dp or numeric)	和输入相同	以10为底的对数	log(100.0)	2
log10(dp or numeric)	和输入相同	以10为底的对数	log10(100.0)	2
log(b numeric, x numeric)	numeric	以b为底的对数	log(2.0, 64.0)	6.0000000000
mod(y, x)	和参数类型相同	y/x的余数	mod(9,4)	1
pi()	dp	“π”常数	pi()	3.14159265358979
power(a dp, b dp)	dp	求a的b次幂	power(9.0, 3.0)	729
power(a numeric, b numeric)	numeric	求a的b次幂	power(9.0, 3.0)	729
radians(dp)	dp	把角度转为弧度	radians(45.0)	0.785398163397448
round(dp or numeric)	和输入相同	圆整为最接近的整数	round(42.4)	42
round(v numeric, s int)	numeric	圆整为s位小数数字	round(42.4382, 2)	42.44
scale(numeric)	integer	参数的精度（小数点后的位数）	scale(8.41)	2
sign(dp or numeric)	和输入相同	参数的符号（-1, 0, +1）	sign(-8.4)	-1
sqrt(dp or numeric)	和输入相同	平方根	sqrt(2.0)	1.4142135623731
trunc(dp or numeric)	和输入相同	截断（向零靠近）	trunc(42.8)	42
trunc(v numeric, s int)	numeric	截断为s位小数位置的数字	trunc(42.4382, 2)	42.43

3.逻辑计算

3.1 逻辑操作符

postgresql中的逻辑操作符，有以下三种：
AND
OR
NOT

3.2 比较操作符

操作符	描述
<	小于
>	大于
<=	小于等于
>=	大于等于
=	等于
<> or !=	不等于

!=操作符在分析器阶段被转换成<>

3.3 比较谓词

谓词	描述
a BETWEEN x AND y	在x和y之间
a NOT BETWEEN x AND y	不在x和y之间
a BETWEEN SYMMETRIC x AND y	在对比较值排序后位于x和y之间
a NOT BETWEEN SYMMETRIC x AND y	在对比较值排序后不位于x和y之间
a IS DISTINCT FROM b	不等于，空值被当做一个普通值
a IS NOT DISTINCT FROM b	等于，空值被当做一个普通值
expression IS NULL	是空值
expression IS NOT NULL	不是空值
expression ISNULL	是空值（非标准语法）
expression NOTNULL	不是空值（非标准语法）
boolean_expression IS TRUE	为真
boolean_expression IS NOT TRUE	为假或未知
boolean_expression IS FALSE	为假
boolean_expression IS NOT FALSE	为真或者未知
boolean_expression IS UNKNOWN	值为未知
boolean_expression IS NOT UNKNOWN	为真或者为假

3.4 比较函数

函数	描述	例子	例子结果
num_nonnulls(VARIADIC “any”)	返回非空参数的数量	num_nonnulls(0, NULL, 1 ,2 ,3)	4
num_nulls(VARIADIC “any”)	返回空参数的数量	num_nulls(0, NULL, 1 ,2 ,3)	1

4.字符串及相关匹配函数

函数	返回类型	描述	例子	结果
string \|\| string	text	串接	‘Hello’ \|\| ‘Word’	‘HelloWord’
string \|\| non-string or non-string \|\| string	text	使用一个非字符串输入的串接	'Value: ’ \|\| 42	Value: 42
bit_length(string)	int	串中的位数	bit_length(‘Hello’)	40
char_length(string) or character_length(string)	int	串中字符数	char_length(‘Hello’)	4
lower(string)	text	将字符串转换为小写形式	lower(‘Hello’)	hello
overlay(string placing string from int [for int])	text	替换子串,for后面是指替换的位数	overlay(‘Hexxx,word’ placing ‘llo’ from 3 for 4)	Helloword
position(substring in string)	int	定位指定子串位置，可利用值是否大于0来判断是否包含子串	position(‘lo’ in ‘hello’)	4
substring(string [from int] [for int])	text	提取子串	substring(‘hello’ from 1 for 3)	hel
substring(string from pattern)	text	提取匹配POSIX正则表达式的子串	substring(‘hello’ from ‘^…’)	hel
substr(string, from [, count])	text	提取子串	substr(‘Hello’, 1, 3)	hel
trim([leading \| trailing \| both] [characters] from string)	text	从string的开头、结尾或者两端（both是默认值）移除只包含characters（默认是一个空格）中字符的最长字符串	trim(both ‘Hes’ from ‘sHehelloeHs’)	hello
trim([leading \| trailing \| both] [from] string [, characters] )	text	trim()的非标准版本	trim(both from ‘hhHellohh’, ‘h’) 或trim(‘hhHellohh’, ‘h’)	Tom
upper(string)	text	将字符串转换成大写形式	upper(‘hello’)	HELLO
concat(str “any” [, str “any” [, …] ])	text	串接所有参数的文本表示。NULL 参数被忽略。	concat(‘abcde’, 2, NULL, 22)	abcde222
concat_ws(sep text, str “any” [, str “any” [, …] ])	text	将除了第一个参数外的其他参数用分隔符串接在一起。第一个参数被用作分隔符字符串。NULL 参数被忽略。	concat_ws(‘,’, ‘abcde’, 2, NULL, 22)	abcde,2,22
left(str text, n int)	text	返回字符串中的前n个字符。当n为负时，将返回除了最后\|n\|个字符之外的所有字符。	left(‘abcde’, 2)	ab
length(string)	int	string中的字符数	length(‘hello’)	5
length(string bytea, encoding name )	int	string在给定编码中的字符数。string必须在这个编码中有效。	length(‘hello’, ‘UTF8’)	5
lpad(string text, length int [, fill text])	text	将string通过前置字符fill（默认是一个空格）填充到长度length。如果string已经长于length，则它被（从右边）截断。	lpad(‘hi’, 5, ‘ab’)	abahi
ltrim(string text [, characters text])	text	从string的开头删除最长的只包含characters（默认是一个空格）的串	ltrim(‘zzzytest’, ‘xyz’)	test
regexp_match(string text, pattern text [, flags text])	text[]	返回一个POSIX正则表达式与string的第一个匹配得到的子串。	regexp_match(‘foobarbequetarz’, ‘(foo)(bar)’)	一行：{foo,bar}
regexp_matches(string text, pattern text [, flags text])	setof text[]	返回一个POSIX正则表达式与string匹配得到的子串	regexp_matches(‘foobarbequetarz’, ‘.ar’, ‘g’)	两行：{bar} {tar}
regexp_replace(string text, pattern text, replacement text [, flags text])	text	替换匹配一个POSIX正则表达式的子串。	regexp_replace(‘Hello’, ‘l+.’, ‘r’)	Her
regexp_split_to_array(string text, pattern text [, flags text ])	text[]	使用一个POSIX正则表达式作为分隔符划分string。	regexp_split_to_array(‘hello world’, ‘\s+’)	一行：{hello,world}
regexp_split_to_table(string text, pattern text [, flags text]) setof	text	使用一个POSIX正则表达式作为分隔符划分string。	regexp_split_to_table(‘hello world’, ‘\s+’)	两行：hello world
repeat(string text, number int)	text	重复string指定的number次	repeat(‘he’, 3)	hehehe
replace(string text, from text, to text)	text	将string中出现的所有子串from替换为子串to	replace(‘hello’, ‘ello’, ‘is’)	his
reverse(str)	text	返回反转的字符串	reverse(‘abcde’)	edcba
right(str text, n int)	text	返回字符串中的最后n个字符。如果n为负，返回除最前面的\|n\|个字符外的所有字符。	right(‘abcde’, 2)	de
rpad(string text, length int [, fill text])	text	将string通过增加字符fill（默认为一个空格）填充到长度length。如果string已经长于length则它会被截断。	rpad(‘hi’, 5, ‘xy’)	hixyx
rtrim(string text [, characters text])	text	从string的结尾删除最长的只包含characters（默认是一个空格）的串	rtrim(‘testxxzx’, ‘xyz’)	test
split_part(string text, delimiter text, field int)	text	按delimiter划分string并返回给定域（从1开始计算）	split_part(‘you!hello!world!’, ‘!’, 2)	hello
strpos(string, substring)	int	指定子串的位置（和position(substring in string)相同，但是注意相反的参数顺序）	strpos(‘hello’, ‘o’)	5
starts_with(string, prefix)	bool	如果string以prefix开始则返回真。	starts_with(‘alphabet’, ‘alph’)	t

5.时间与日期函数

5.1时间类操作符

操作符	例子	结果
+	date ‘2001-09-28’ + integer ‘7’	date ‘2001-10-05’
+	date ‘2001-09-28’ + interval ‘1 hour’	timestamp ‘2001-09-28 01:00:00’
+	date ‘2001-09-28’ + time ‘03:00’	timestamp ‘2001-09-28 03:00:00’
+	interval ‘1 day’ + interval ‘1 hour’	interval ‘1 day 01:00:00’
+	timestamp ‘2001-09-28 01:00’ + interval ‘23 hours’	timestamp ‘2001-09-29 00:00:00’
+	time ‘01:00’ + interval ‘3 hours’	time ‘04:00:00’
-	- interval ‘23 hours’	interval ‘-23:00:00’
-	date ‘2001-10-01’ - date ‘2001-09-28’	integer ‘3’ (days)
-	date ‘2001-10-01’ - integer ‘7’	date ‘2001-09-24’
-	date ‘2001-09-28’ - interval ‘1 hour’	timestamp ‘2001-09-27 23:00:00’
-	time ‘05:00’ - time ‘03:00’	interval ‘02:00:00’
-	time ‘05:00’ - interval ‘2 hours’	time ‘03:00:00’
-	timestamp ‘2001-09-28 23:00’ - interval ‘23 hours’	timestamp ‘2001-09-28 00:00:00’
-	interval ‘1 day’ - interval ‘1 hour’	interval ‘1 day -01:00:00’
-	timestamp ‘2001-09-29 03:00’ - timestamp ‘2001-09-27 12:00’	interval ‘1 day 15:00:00’
*	900 * interval ‘1 second’	interval ‘00:15:00’
*	21 * interval ‘1 day’	interval ‘21 days’
*	double precision ‘3.5’ * interval ‘1 hour’	interval ‘03:30:00’
/	interval ‘1 hour’ / double precision ‘1.5’	interval ‘00:40:00’

5.2 时间、日期类函数

函数	返回类型	描述	例子	结果
age(timestamp, timestamp)	interval	减去参数，生成一个使用年、月（而不是只用日）的“符号化”的结果	age(timestamp ‘2001-04-10’, timestamp ‘1957-06-13’)	43 years 9 mons 27 days
age(timestamp)	interval	从current_date（在午夜）减去	age(timestamp ‘1957-06-13’)，假如今日为2022-06-14	65 years 1 day
clock_timestamp()	timestamp with time zone	当前日期和时间（在语句执行期间变化）	clock_timestamp()	2022-06-14 19:06:54.034672+08
current_date	date	当前日期	current_date	2022-06-14
current_time	time with time zone	当前时间（一天中的时间），带时区	current_time	19:11:04.336139+08
current_timestamp	timestamp with time zone	当前日期和时间（当前事务开始时），带时区	current_timestamp	2022-06-14 19:11:57.83455+08
date_part(text, timestamp)	double precision	获得子域（等价于extract）	date_part(‘hour’, timestamp ‘2022-06-14 20:38:40’)	20
date_part(text, interval)	double precision	获得子域（等价于extract）	date_part(‘month’, interval ‘2 years 3 months’)	3
date_trunc(text, timestamp)	timestamp	截断到指定精度	date_trunc(‘hour’, timestamp ‘2022-06-14 20:38:40’)	2022-06-14 20:00:00
date_trunc(text, timestamp with time zone, text)	timestamp with time zone	在指定的时区截断到指定的精度	ddate_trunc(‘day’, timestamptz ‘2022-06-14 20:38:40+00’, ‘Australia/Sydney’)	2022-06-14 22:00:00+08
date_trunc(text, interval)	interval	截断到指定精度	date_trunc(‘hour’, interval ‘2 days 3 hours 40 minutes’)	2 days 03:00:00
extract(field from timestamp)	double precision	获得子域	extract(MINUTE from timestamp ‘2022-06-14 20:38:40’)	38
extract(field from interval)	double precision	获得子域	extract(month from interval ‘2 years 3 months’)	3
isfinite(date)	boolean	测试有限日期（不是+/-无限）	isfinite(date ‘2022-06-14’)	true（实际缩写为t）
isfinite(timestamp)	boolean	测试有限时间戳（不是+/-无限）	isfinite(timestamp ‘2022-06-14 21:28:30’)	true（实际缩写为t）
isfinite(interval)	boolean	测试有限间隔	isfinite(interval ‘2 minutes’)	true（实际缩写为t）
justify_days(interval)	interval	调整间隔这样30天时间周期可以表示为月	justify_days(interval ‘35 days’)	1 mon 5 days
justify_hours(interval)	interval	调整间隔这样24小时时间周期可以表示为日	justify_hours(interval ‘27 hours’)	1 day 03:00:00
justify_interval(interval)	interval	使用justify_days和justify_hours调整间隔，使用额外的符号调整	justify_interval(interval ‘1 mon -1 hour’)	29 days 23:00:00
localtime	time	当前时间（一天中的时间），不带时区	localtime	19:21:14.958286
localtimestamp	timestamp	当前日期和时间（当前事务的开始），不带时区	LOCALTIMESTAMP	2022-07-22 19:23:54.073462
make_date(year int, month int, day int)	date	从年、月、日域创建日期	make_date(2022, 7, 15)	2022-07-15
make_interval(years int DEFAULT 0, months int DEFAULT 0, weeks int DEFAULT 0, days int DEFAULT 0, hours int DEFAULT 0, mins int DEFAULT 0, secs double precision DEFAULT 0.0)	interval	从年、月、周、日、时、分、秒域创建interval	make_interval(days => 10)	10 days
make_time(hour int, min int, sec double precision)	time	从时、分、秒域创建时间	make_time(8, 15, 23.5)	08:15:23.5
make_timestamp(year int, month int, day int, hour int, min int, sec double precision)	timestamp	从年、月、日、时、分、秒域创建时间戳	make_timestamp(2013, 7, 15, 8, 15, 23.5)	2013-07-15 08:15:23.5
make_timestamptz(year int, month int, day int, hour int, min int, sec double precision, [ timezone text ])	timestamp with time zone	从年、月、日、时、分、秒域创建带时区的时间戳。如果没有指定timezone，则使用当前时区。	make_timestamptz(2022, 6, 14, 19, 30, 50.5)	2022-06-14 19:30:50.5+08
now()	timestamp with time zone	当前日期和时间（当前事务的开始），带时区	now()	2022-07-22 19:28:15.804042+08
statement_timestamp()	timestamp with time zone	当前日期和时间（当前语句的开始），在一个事务的第一条命令期间返回值与CURRENT_TIMESTAMP相同	statement_timestamp()	2022-07-22 19:31:35.75589+08
timeofday()	text	当前日期和时间（像clock_timestamp，但是作为一个text字符串）	timeofday()	Fri Jul 22 19:35:19.000959 2022 CST
transaction_timestamp()	timestamp with time zone	当前日期和时间（当前事务的开始）；等同于CURRENT_TIMESTAMP	transaction_timestamp()	2022-07-22 19:34:02.369665+08
to_timestamp(double precision)	timestamp with time zone	把 Unix 时间（从 1970-01-01 00:00:00+00 开始的秒）转换成 timestamp	to_timestamp(1655211000)	2022-06-14 20:50:00+08

6.数组函数

6.1 数组操作符

操作符	描述	例子	结果
=	等于	ARRAY[1.1,2.1,3.1]::int[] = ARRAY[1,2,3]	t
<>	不等于	ARRAY[1,2,3] <> ARRAY[1,2,4]	t
<	小于	ARRAY[1,2,3] < ARRAY[1,2,4]	t
>	大于	ARRAY[1,4,3] > ARRAY[1,2,4]	t
<=	小于等于	ARRAY[1,2,3] <= ARRAY[1,2,3]	t
>=	大于等于	ARRAY[1,4,3] >= ARRAY[1,4,3]	t
@>	包含	ARRAY[1,4,3] @> ARRAY[3,1,3]	t
<@	被包含	ARRAY[2,2,7] <@ ARRAY[1,7,4,2,6]	t
&&	重叠（具有公共元素）	ARRAY[1,4,3] && ARRAY[2,1]	t
\|\|	数组和数组串接	ARRAY[1,2,3] \|\| ARRAY[4,5,6]	{1,2,3,4,5,6}
\|\|	数组和数组串接	ARRAY[1,2,3] \|\| ARRAY[[4,5,6],[7,8,9]]	{ {1,2,3},{4,5,6},{7,8,9}}
\|\|	元素到数组串接	3 \|\| ARRAY[4,5,6]	{3,4,5,6}
\|\|	数组到元素串接	ARRAY[4,5,6] \|\| 7	{4,5,6,7}

6.2 数组函数

函数	返回类型	描述	例子	结果
array_append(anyarray, anyelement)	anyarray	向一个数组的末端追加一个元素	array_append(ARRAY[1,2], 3)	{1,2,3}
array_cat(anyarray, anyarray)	anyarray	连接两个数组	array_cat(ARRAY[1,2,3], ARRAY[4,5])	{1,2,3,4,5}
array_ndims(anyarray)	int	返回数组的维度数	array_ndims(ARRAY[[1,2,3], [4,5,6]])	2
array_dims(anyarray)	text	返回数组的维度的文本表示	array_dims(ARRAY[[1,2,3], [4,5,6]])	[1:2][1:3]
array_fill(anyelement, int[], [, int[]])	anyarray	返回一个用提供的值和维度初始化好的数组，可以选择下界不为1	array_fill(6, ARRAY[3], ARRAY[5])	[5:7]={6,6,6}
array_length(anyarray, int)	int	返回被请求的数组维度的长度	array_length(array[1,2,3], 1)	3
array_lower(anyarray, int)	int	返回被请求的数组维度的下界	array_lower(‘[0:2]={1,2,3}’::int[], 1)	0
array_position(anyarray, anyelement [, int])	int	返回在该数组中从第三个参数指定的元素开始或者第一个元素开始（数组必须是一维的）、第二个参数的第一次出现的下标	array_position(ARRAY[‘sun’,‘mon’,‘tue’,‘wed’,‘thu’,‘fri’,‘sat’], ‘mon’)	2
array_positions(anyarray, anyelement)	int[]	返回在第一个参数给定的数组（数组必须是一维的）中，第二个参数所有出现位置的下标组成的数组	array_positions(ARRAY[‘A’,‘A’,‘B’,‘A’], ‘A’)	{1,2,4}
array_prepend(anyelement, anyarray)	anyarray	向一个数组的首部追加一个元素	array_prepend(1, ARRAY[2,3])	{1,2,3}
array_remove(anyarray, anyelement)	anyarray	从数组中移除所有等于给定值的所有元素（数组必须是一维的）	array_remove(ARRAY[1,2,3,2], 2)	{1,3}
array_replace(anyarray, anyelement, anyelement)	anyarray	将每一个等于给定值的数组元素替换成一个新值	array_replace(ARRAY[1,2,5,4], 5, 3)	{1,2,3,4}
array_to_string(anyarray, text [, text])	text	使用提供的定界符和可选的空串连接数组元素	array_to_string(ARRAY[1, 2, 3, NULL, 5], ‘,’, ‘*’)	‘1,2,3,*,5’
array_upper(anyarray, int)	int	返回被请求的数组维度的上界	array_upper(ARRAY[1,8,3,7], 1)	4
cardinality(anyarray)	int	返回数组中元素的总数，如果数组为空则返回0	cardinality(ARRAY[[1,2],[3,4]])	4
string_to_array(text, text [, text])	text[]	使用提供的定界符和可选的空串将字符串划分成数组元素	string_to_array(‘a-b-c-d-e-g-’, ‘-’, ‘’)	{a,b,c,d,e,g,NULL}
unnest(anyarray)	setof anyelement	将一个数组扩展成一组行	unnest(ARRAY[1,2])	2行：1 2

7.范围函数

7.1 范围操作符

操作符	描述	例子	结果
=	等于	int4range(1,5) = ‘[1,4]’::int4range	t
<>	不等于	numrange(1.1,2.2) <> numrange(1.1,2.3)	t
<	小于	int4range(1,10) < int4range(2,3)	t
>	大于	int4range(1,10) > int4range(1,5)	t
<=	小于等于	numrange(1.1,2.2) <= numrange(1.1,2.2)	t
>=	大于等于	numrange(1.1,2.2) >= numrange(1.1,2.0)	t
@>	包含范围	int4range(2,4) @> int4range(2,3)	t
@>	包含元素	‘[2011-01-01,2011-03-01)’::tsrange @> ‘2011-01-10’::timestamp	t
<@	范围被包含	int4range(2,4) <@ int4range(1,7)	t
<@	元素被包含	42 <@ int4range(1,7)	f
&&	重叠（有公共点）	int8range(3,7) && int8range(4,12)	t
<<	严格左部	int8range(1,10) << int8range(100,110)	t
>>	严格右部	int8range(50,60) >> int8range(20,30)	t
&<	不超过右部	int8range(1,20) &< int8range(18,20) t
&>	不超过左部	int8range(7,20) &> int8range(5,10)	t
-\|-	相邻	numrange(1.1,2.2) -\|- numrange(2.2,3.3)	t
+	并	numrange(5,15) + numrange(10,20)	[5,20)
*	交	int8range(5,15) * int8range(10,20)	[10,15)
-	差	int8range(5,15) - int8range(10,20)	[5,10)

7.2 范围函数

函数	返回类型	描述	例子	结果
lower(anyrange)	范围的元素类型	范围的下界	lower(numrange(1.1,2.2))	1.1
upper(anyrange)	范围的元素类型	范围的上界	upper(numrange(1.1,2.2))	2.2
isempty(anyrange)	boolean	范围为空？	isempty(numrange(1.1,2.2))	false
lower_inc(anyrange)	boolean	下界包含在内？	lower_inc(numrange(1.1,2.2))	true
upper_inc(anyrange)	boolean	上界包含在内？	upper_inc(numrange(1.1,2.2))	false
lower_inf(anyrange)	boolean	下界无限？	lower_inf(‘(,)’::daterange)	true
upper_inf(anyrange)	boolean	上界无限？	upper_inf(‘(,)’::daterange)	true
range_merge(anyrange, anyrange)	anyrange	包含两个给定范围的最小范围	range_merge(‘[1,2)’::int4range, ‘[3,4)’::int4range)	[1,4)

8.聚集函数

8.1 常用函数

函数	参数类型	返回类型	部分模式	描述
array_agg(expression)	任何非数组类型	参数类型的数组	No	输入值（包括空）被连接到一个数组
array_agg(expression)	任意数组类型	和参数数据类型相同	No	输入数组被串接到一个更高维度的数组中（输入必须都具有相同的维度并且不能为空或者 NULL）
avg(expression)	smallint, int, bigint、real、double precision、numeric或interval	对于任何整数类型参数是numeric，对于一个浮点参数是double precision，否则和参数数据类型相同	Yes	所有非空输入值的平均值（算术平均）
bit_and(expression)	smallint、int、bigint或bit	与参数数据类型相同	Yes	所有非空输入值的按位与，如果没有非空值则结果是空值
bit_or(expression)	smallint, int, bigint, or bit	与参数数据类型相同	Yes	所有非空输入值的按位或，如果没有非空值则结果是空值
bool_and(expression)	bool	bool	Yes	如果所有输入值为真则结果为真，否则为假
bool_or(expression)	bool	bool	Yes	至少一个输入值为真时结果为真，否则为假
count(*)		bigint	Yes	输入的行数
count(expression)	any	bigint	Yes	expression值非空的输入行的数目
every(expression)	bool	bool	Yes	等价于bool_and
json_agg(expression)	any	json	No	将值，包含空值，聚集成一个 JSON 数组
jsonb_agg(expression)	any	jsonb	No	把值，包含空值，聚合成一个 JSON 数组
json_object_agg(name, value)	(any, any)	json	No	将名字/值对聚集成一个 JSON 对象，值可以为空，但不能是名字。
jsonb_object_agg(name, value)	(any, any)	jsonb	No	把名字/值对聚合成一个 JSON 对象，值可以为空，但不能是名字。
max(expression)	任意数组、数字、串、日期/时间、网络或者枚举类型，或者这些类型的数组	与参数数据类型相同	Yes	所有非空输入值中expression的最大值
min(expression)	任意数组、数字、串、日期/时间、网络或者枚举类型，或者这些类型的数组	与参数数据类型相同	Yes	所有非空输入值中expression的最小值
string_agg(expression, delimiter)	(text, text) 或 (bytea, bytea)	与参数数据类型相同	No	非空输入值连接成一个串，用定界符分隔
sum(expression)	smallint、int、 bigint、real、double precision、numeric、 interval或money	对smallint或int参数是bigint，对bigint参数是numeric，否则和参数数据类型相同	Yes	所有非空输入值的expression的和
xmlagg(expression)	xml	xml	No	连接非空XML值

8.2 统计类函数

函数	参数类型	返回类型	部分模式	描述
array_agg(expression)	任何非数组类型	参数类型的数组	No	输入值（包括空）被连接到一个数组
array_agg(expression)	任意数组类型	和参数数据类型相同	No	输入数组被串接到一个更高维度的数组中（输入必须都具有相同的维度并且不能为空或者 NULL）
avg(expression)	smallint, int, bigint、real、double precision、numeric或interval	对于任何整数类型参数是numeric，对于一个浮点参数是double precision，否则和参数数据类型相同	Yes	所有非空输入值的平均值（算术平均）
bit_and(expression)	smallint、int、bigint或bit	与参数数据类型相同	Yes	所有非空输入值的按位与，如果没有非空值则结果是空值
bit_or(expression)	smallint, int, bigint, or bit	与参数数据类型相同	Yes	所有非空输入值的按位或，如果没有非空值则结果是空值
bool_and(expression)	bool	bool	Yes	如果所有输入值为真则结果为真，否则为假
bool_or(expression)	bool	bool	Yes	至少一个输入值为真时结果为真，否则为假
count(*)		bigint	Yes	输入的行数
count(expression)	any	bigint	Yes	expression值非空的输入行的数目
every(expression)	bool	bool	Yes	等价于bool_and
json_agg(expression)	any	json	No	将值，包含空值，聚集成一个 JSON 数组
jsonb_agg(expression)	any	jsonb	No	把值，包含空值，聚合成一个 JSON 数组
json_object_agg(name, value)	(any, any)	json	No	将名字/值对聚集成一个 JSON 对象，值可以为空，但不能是名字。
jsonb_object_agg(name, value)	(any, any)	jsonb	No	把名字/值对聚合成一个 JSON 对象，值可以为空，但不能是名字。
max(expression)	任意数组、数字、串、日期/时间、网络或者枚举类型，或者这些类型的数组	与参数数据类型相同	Yes	所有非空输入值中expression的最大值
min(expression)	任意数组、数字、串、日期/时间、网络或者枚举类型，或者这些类型的数组	与参数数据类型相同	Yes	所有非空输入值中expression的最小值
string_agg(expression, delimiter)	(text, text) 或 (bytea, bytea)	与参数数据类型相同	No	非空输入值连接成一个串，用定界符分隔
sum(expression)	smallint、int、 bigint、real、double precision、numeric、 interval或money	对smallint或int参数是bigint，对bigint参数是numeric，否则和参数数据类型相同	Yes	所有非空输入值的expression的和
xmlagg(expression)	xml	xml	No	连接非空XML值

8.3 有序集聚集函数

函数	参数类型	返回类型	部分模式	描述
corr(Y, X)	double precision	double precision	Yes	相关系数
covar_pop(Y, X)	double precision	double precision	Yes	总体协方差
covar_samp(Y, X)	double precision	double precision	Yes	样本协方差
regr_avgx(Y, X)	double precision	double precision	Yes	自变量的平均值（sum(X)/N）
regr_avgy(Y, X)	double precision	double precision	Yes	因变量的平均值（sum(Y)/N）
regr_count(Y, X)	double precision	bigint	Yes	两个表达式都不为空的输入行的数目
regr_intercept(Y, X)	double precision	double precision	Yes	由（X, Y）对决定的最小二乘拟合的线性方程的 y截距
regr_r2(Y, X)	double precision	double precision	Yes	相关系数的平方
regr_slope(Y, X)	double precision	double precision	Yes	由（X, Y）对决定的最小二乘拟合的线性方程的斜率
regr_sxx(Y, X)	double precision	double precision	Yes	sum(X^2) - sum(X)^2/N（自变量的“平方和”）
regr_sxy(Y, X)	double precision	double precision	Yes	sum(XY) - sum(X) sum(Y)/N（自变量乘以因变量的“积之合”）
regr_syy(Y, X)	double precision	double precision	Yes	sum(Y^2) - sum(Y)^2/N（因变量的“平方和”）
stddev(expression)	smallint、int、 bigint、real、double precision或numeric	浮点参数为double precision，否则为numeric	Yes	stddev_samp的历史别名
stddev_pop(expression)	smallint、int、 bigint、real、double precision或numeric	浮点参数为double precision，否则为numeric	Yes	输入值的总体标准偏差
stddev_samp(expression)	smallint、int、 bigint、real、double precision或numeric	浮点参数为double precision，否则为numeric	Yes	输入值的样本标准偏差
variance(expression)	smallint、int、 bigint、real、double precision或numeric	浮点参数为double precision，否则为numeric	Yes	var_samp的历史别名
var_pop(expression)	smallint、int、 bigint、real、double precision或numeric	浮点参数为double precision，否则为numeric	Yes	输入值的总体方差（总体标准偏差的平方）
var_samp(expression)	smallint、int、 bigint、real、double precision或numeric	浮点参数为double precision，否则为numeric	Yes	输入值的样本方差（样本标准偏差的平方）

8.4 有序数据集

函数	直接参数类型	聚集参数类型	返回类型	部分模式	描述
mode() WITHIN GROUP (ORDER BY sort_expression)		任何可排序类型	与排序表达式相同	No	返回最频繁的输入值（如果有多个频度相同的值就选第一个）
percentile_cont(fraction) WITHIN GROUP (ORDER BY sort_expression)	double precision	double precision或者interval	与排序表达式相同	No	连续百分率：返回一个对应于排序中指定分数的值，如有必要就在相邻的输入项之间插值
percentile_cont(fractions) WITHIN GROUP (ORDER BY sort_expression)	double precision[]	double precision或者interval	排序表达式的类型的数组	No	多重连续百分率：返回一个匹配fractions参数形状的结果数组，其中每一个非空元素都用对应于那个百分率的值替换
percentile_disc(fraction) WITHIN GROUP (ORDER BY sort_expression)	double precision	一种可排序类型	与排序表达式相同	No	离散百分率：返回第一个在排序中位置等于或者超过指定分数的输入值
percentile_disc(fractions) WITHIN GROUP (ORDER BY sort_expression)	double precision[]	任何可排序类型	排序表达式的类型的数组	No	多重离散百分率：返回一个匹配fractions参数形状的结果数组，其中每一个非空元素都用对应于那个百分率的输入值替换

8.5 假想集聚集函数(排序)

函数	直接参数类型	聚集参数类型	返回类型	部分模式	描述
rank(args) WITHIN GROUP (ORDER BY sorted_args)	VARIADIC “any”	VARIADIC “any”	bigint	No	假想行的排名，为重复的行留下间隔
dense_rank(args) WITHIN GROUP (ORDER BY sorted_args)	VARIADIC “any”	VARIADIC “any”	bigint	No	假想行的排名，不留间隔
percent_rank(args) WITHIN GROUP (ORDER BY sorted_args)	VARIADIC “any”	VARIADIC “any”	double precision	No	假想行的相对排名，范围从 0 到 1
cume_dist(args) WITHIN GROUP (ORDER BY sorted_args) VARIADIC “any”	VARIADIC “any”	double precision		No	假想行的相对排名，范围从 1/N 到 1

8.6 分组操作

函数	返回类型	描述
GROUPING(args…)	integer	整数位掩码指示哪些参数不被包括在当前分组集合中

使用方法举例

WITH test_table AS (
	SELECT UNNEST( ARRAY [ '财务', '行政', '销售', '财务', '行政', '行政' ] ) AS depart,
		UNNEST ( ARRAY [ 'A', 'B', 'A', 'C', 'D', 'C' ] ) AS NAME,
		UNNEST ( ARRAY [ 200, 100, 50, 30, 200, 100 ] ) AS donate 
	) SELECT
	depart,
	NAME,
	GROUPING ( depart, NAME ),
	SUM ( donate ),
	COUNT ( donate ) 
FROM
	test_table 
GROUP BY
	ROLLUP ( depart, NAME );

9.条件类函数

函数	语法	使用说明	使用例子
case	CASE WHEN condition THEN result [WHEN …] [ELSE result] END	CASE子句可以用于任何表达式可以出现的地方。每一个condition是一个返回boolean结果的表达式。如果结果为真，那么CASE表达式的结果就是符合条件的result，并且剩下的CASE表达式不会被处理。如果条件的结果不为真，那么以相同方式搜寻任何随后的WHEN子句。如果没有WHEN condition为真，那么CASE表达式的值就是在ELSE子句里的result。如果省略了ELSE子句而且没有条件为真，结果为空。	CASE WHEN a=1 THEN ‘one’ WHEN a=2 THEN ‘two’ ELSE 'other’END
coalesce	COALESCE(value [, …])	返回它的第一个非空参数的值。当且仅当所有参数都为空时才会返回空。它常用于在为显示目的检索数据时用缺省值替换空值。	COALESCE(description, short_description, ‘(none)’)
nullif	NULLIF(value1, value2)	当value1和value2相等时，NULLIF返回一个空值。否则它返回value1。	NULLIF(value, ‘(none)’)
greatest	GREATEST(value [, …])	从一个任意的数字表达式列表里选取最大的数值。列表中的 NULL 数值将被忽略。只有所有表达式的结果都是 NULL 的时候，结果才会是 NULL。	greatest(2,5,1)
least	GREATEST(value [, …])	从一个任意的数字表达式列表里选取最小的数值。列表中的 NULL 数值将被忽略。只有所有表达式的结果都是 NULL 的时候，结果才会是 NULL。	least(2,6,5)

10.窗口函数

函数	返回类型	描述
row_number()	bigint	当前行在其分区中的行号，从1计
rank()	bigint	带间隙的当前行排名；与该行的第一个同等行的row_number相同
dense_rank()	bigint	不带间隙的当前行排名；这个函数计数同等组
percent_rank()	double precision	当前行的相对排名： (rank- 1) / (总行数 - 1)
cume_dist()	double precision	累积分布：(在当前行之前或者平级的分区行数) / 分区行总数
ntile(num_buckets integer)	integer	从1到参数值的整数范围，尽可能等分分区
lag(value anyelement [, offset integer [, default anyelement ]])	和value的类型相同	返回value，它在分区内当前行的之前offset个位置的行上计算；如果没有这样的行，返回default替代（必须和value类型相同）。offset和default都是根据当前行计算的结果。如果忽略它们，则offset默认是1，default默认是空值
lead(value anyelement [, offset integer [, default anyelement ]])	和value类型相同	返回value，它在分区内当前行的之后offset个位置的行上计算；如果没有这样的行，返回default替代（必须和value类型相同）。offset和default都是根据当前行计算的结果。如果忽略它们，则offset默认是1，default默认是空值
first_value(value any)	same type as value	返回在窗口帧中第一行上计算的value
last_value(value any)	和value类型相同	返回在窗口帧中最后一行上计算的value
nth_value(value any, nth integer)	和value类型相同	返回在窗口帧中第nth行（行从1计数）上计算的value；没有这样的行则返回空值

11.查看内部所有函数

如何查看postgresql中所有的函数名称，SQL语句如下：

-- 查看所有函数名，返回类型，及参数个数
SELECT
  pg_proc.proname AS "函数名称",
  pg_type.typname AS "返回值数据类型",
  pg_proc.pronargs AS "参数个数"
FROM
  pg_proc
JOIN pg_type ON (pg_proc.prorettype = pg_type.oid)
-- WHERE pronamespace = (SELECT pg_namespace.oid FROM pg_namespace WHERE nspname = '模式')