Esper学习笔记三:EPL语法(1)

1.EPL语法简介

EPL全称Event Processing Language,是一种类似SQL的语言,包含了SELECT, FROM, WHERE, GROUP BY, HAVING 和 ORDER BY子句,同时用事件流代替了table作为数据源,并且能像SQL那样join,filtering和aggregation。除了select,EPL也有insert into,update,delete,不过含义和SQL并不是很接近。另外还有pattern和output子句,这两个是SQL所没有的。EPL还定义了一个叫view的东西,类似SQL的table,来决定哪些数据是可用的,Esper提供了十多个view,并且保证这些view可以被重复使用。而且用户还可以扩展view成为自定义view来满足需求。在view的基础上,EPL还提供了named window的定义,作用和view类似,但是更加灵活。

2.语法

大部分EPL语句都遵循以下格式

[annotations]
[expression_declarations]
[context context_name]
[insert into insert_into_def]
select select_list
from stream_def [as name] [, stream_def [as name]] [,...]
[where search_conditions]
[group by grouping_expression_list]
[having grouping_search_conditions]
[output output_specification]
[order by order_by_expression_list]
[limit num_rows]

3.时间周期

time-period : [year-part] [month-part] [week-part] [day-part] [hour-part] [minute-part] [seconds-part] [milliseconds-part]

year-part : (number|variable_name) ("years" | "year")
month-part : (number|variable_name) ("months" | "month")
week-part : (number|variable_name) ("weeks" | "week")
day-part : (number|variable_name) ("days" | "day")
hour-part : (number|variable_name) ("hours" | "hour")
minute-part : (number|variable_name) ("minutes" | "minute" | "min")
seconds-part : (number|variable_name) ("seconds" | "second" | "sec")
milliseconds-part : (number|variable_name) ("milliseconds" | "millisecond" | "msec")

时间范围在EPL中的使用:

select avg(price) from Fruit.win:time(5 minute 3 sec) //在5分3秒中统计price平均值。
select sum(account) from User output every 1 day //每天输出一次计算结果

Esper规定每月的天数都是30天,所以对准确性要求高的业务,以月为单位进行计算会出现误差的。

4.注解

EPL也可以写注解,种类不多,大部分简单而有效

// 不包含参数或者单个参数的注解
@annotation_name [(annotation_parameters)]
 
// 包含多个属性名-值对的注解
@annotation_name (attribute_name = attribute_value, [name=value, ...])
 
// 多个注解联合使用
@annotation_name [(annotation_parameters)] [@annotation_name [(annotation_parameters)]] [...]

具体注解

1)@Name 指定EPL的名称,参数只有一个。例如:@Name("MyEPL")

2)@Description 对EPL进行描述,参数只有一个。例如:@Description("This is MyEPL")

3)@Tag 对EPL进行额外的说明,参数有两个分别为Tag的名称和Tag的值,用逗号分隔。例如:@Tag(name="author",value="luonanqin")

4)@Priority 指定EPL的优先级,参数只有一个,并且整数(可负可正)。例如:@Priority(10)

5)@Drop 指定事件经过此EPL后不再参与其他的EPL计算,该注解无参数

6)@Hint 为EPL加上某些标记,让引擎对此EPL产生其他的操作,会改变EPL实例的内存占用,但通常不会改变输出。其参数固定,由Esper提供

7)@Audit EPL添加此注解后,可以额外输出EPL运行情况,有点类似日志的感觉(当然没有日志的功能全啦),具体使用场景在此先不提。

8)@Hook 与SQL相关,这里暂且不说

9)@EventRepresentation 这是用来指定EPL产生的计算结果事件包含的数据形式。参数只有一个,即array=true或array=false。false为默认值,代表数据形式为Map,若为true,则数据形式为数组。

5.表达式

类似自定义函数,通常用Lambda表达式来建立的(也有别的方法建立),而Lambda表达式就一个“ => ”符号,表示“gose to”。符号的左边表示输入参数,符号右边表示计算过程,计算结果就是这个表达式的返回值,即Expression的返回值。

语法:

expression expression_name { expression_body }

expression是关键字,expression_name为expression的名称(唯一),expression_body是expression的具体内容。

expression_body语法格式:

expression_body: (input_param [,input_param [,...]]) => expression

例如:

expression middle { x => (x.max+x.min)/2 } select middle(apple) from Apple as apple

x表示输入参数,而x.max和x.min都是x代表的事件流的属性,如果事件流没这个属性,expression的定义就是错误的。

express的定义必须在使用它的句子之前完成。使用时直接写expression的名字和用圆括号包含要计算的参数即可。再次提醒,expression的参数只能是事件流别名,即apple,别名的定义就如上面那样,事件流之后跟着as,然后再跟别名。

多个expression情况

expression sumage { (x,y) => x.age+y.age } select sumage(me,you) from Me as me, You as you

全局表达式

对于expression里用另一个expression,EPL不允许在一个句子里建立两个expression,所以就出现了Global-Expression。普通的expression只作用于定义它的epl,如上面所有的包含select子句的epl就是如此。

create expression expression_name { expression_body }

和普通的expression相比,就是多了个create,不过他不能和别的子句放在一起,即他是单独执行的。

epService.getEPAdministrator().createEPL("create expression avgPrice { x => (x.fist+x.last)/2 }");

在expression使用全局expression

// 先定义全局的avgPrice
create expression avgPrice { x => (x.fist+x.last)/2 }
 
// bananaPrice Banana事件中包含了first和last属性,否则将报错
expression bananaPrice{ x => avgPrice(x) } select bananaPrice(b) from Banana as b

转载:https://blog.csdn.net/luonanqin/article/details/11539221

猜你喜欢

转载自my.oschina.net/u/3100849/blog/1936831