ENVI—基于知识的决策树分类

1. 概述

基于知识的决策树分类是基于遥感影像数据及其他空间数据，通过专家经验总结、简单数学统计和归纳方法等，获得分类规则并进行遥感分类。分类规则易于理解，分类过程也符合人的认知过程，最大的特点是利用多源数据。

专家知识决策树分类的步骤大体上可分为四步：知识（规则）定义、规则输入、决策树运行和分类后处理。难点是规则的获取，可以来自经验总结，如坡度小于 20 度是缓坡等；也可以通过统计的方法从样本中获取规则，如 C4.5 算法、CART 算法、S-PLUS 算法等。

以 Landsat TM5 影像和这个地区对应的 DEM 数据为例，学习基于专家知识决策树分类。

根据经验和专家知识获取如下规则：

注：其中，NDVI 为归一化植被指数；slope 为坡度；aspect 为坡向；bN 代表第 N 个波段。

（1）首先打开待分类数据及其他多源数据。打开 File > Open，选择数据文件夹内的 boulder_tm.dat 和boulder_dem.dat；（注：boulder_tm.dat 为待分类图像，boulder_dem.dat 为DEM 数据。）
（2）打开新建决策树工具，路径为 Toolbox/Classification/Decision Tree/New Decision Tree，如下图所示，默认显示一个节点和两个类别；

（4）点击 OK 后，在弹出的 Variable/File Pairings 对话框内需要为 {ndvi} 指定一个数据源，如下图所示。点击面板中显示 {ndvi} 的表格，然后选择 boulder_tm.dat 即可。
（5）注：因为所选数据具有波长信息，ENVI 自动根据波长识别红波段与近红外波段，如果没有波长，需要手动指定这两个波段。

表达式	部分可用函数
基本运算符	+、-、*、/
三角函数	正弦 Sin(x)、余弦 cos(x)、正切 tan(x) 反正弦 Asin(x)、反余弦 acos(x)、反正切 atan(x) 双曲线正弦 Sinh(x)、双曲线余弦 cosh(x)、双曲线正切 tanh(x)
关系/逻辑	小于 LT、小于等于 LE、等于 EQ、不等于 NE、大于等于 GE、大于 GT and、or、not、XOR 最大值（>）、最小值 (<)
其他符号	指数（^）、自然指数 exp 自然对数 alog(x) 以 10 为底的对数 alog10(x) 取整——round(x)、ceil(x)、fix(x) 平方根（sqrt）、绝对值（abs）

（7）ENVI 决策树分类器中的变量是指一个波段或作用于数据的一个特定函数。如果为波段，需要命名为 bN，其中N 为 1~255 的数字，代表数据的某一个波段；如果为函数，则变量名必须包含在大括号中，即{变量名}，如{ndvi}。如果变量被赋值为多波段文件，变量名必须包含一个写在方括号中的下标，表示波段数，比如{pc[1]}表示主成分分析的第一主成分。支持特定变量名，如下表所示，用户也可以通过 IDL 编写自定义函数。

（9）对 NDVI 大于 0.3，也就是 class1，根据坡度划分成缓坡植被和陡坡植被。在 class1 图标上右键，选择Add Children。单击节点标识符，打开节点属性窗口，Name 为Slope<20，在 Expression 中填写：{Slope} lt 20。

（10）同样的方法，将所有规则输入，末节点图标右键 Edit Properties，可以设置分类结果的名称和颜色，最后结果如下图所示。（注：如果不想自己输入，可以选择 File > Restore Tree…，选择 Tree.txt 即可。）

（注：可以选择菜单 Options > Show Variable / File Pairings 进行参数与变量的数据源设定。结果如下图所示。）

（1）选择 Options > Execute，可以执行决策树。由于使用了多源数据，各个数据可能拥有不同的坐标系、空间分辨率等。在弹出的 Decision Tree Execution Parameters 对话框（如图）中，需要选择输出结果的参照图像，这里选择 boulder_tm.dat，即输出的分类结果的坐标系和空间分辨率等信息与 boulder_tm.dat 相同。
（2）选择输出路径和文件名，点击 OK 即可。（注：此步骤中可以选择空间范围裁剪。）