对数据挖掘clementine软件里面一般性的节点作用描述一下

所有的说明大概在主题说明里面都有。

我毛华望QQ849886241，个人博客http://blog.csdn.net/my_share

企业视图：是一种企业数据库，必须在某个 Clementine 服务器主机上定义同名的 ODBC 数据源。

数据库：数据库源节点可用于使用 ODBC（开放数据库连接）从多种其他数据包中导入数据，这些数据包包括 Microsoft SQL Server、DB2、Oracle 等。

可变文件：可以输入的文件类型很多，但是像图片这种就不支持啦，估计转变成2进制就支持啦。

固定文件：可以使用固定文件节点从固定字段文本文件（其字段没有被分隔，但开始位置相同且长度固定）中导入数据。机器生成的数据或遗存数据通常以固定字段格式存储。使用固定文件节点的“文件”选项卡，可以轻松地指定数据中列的位置和长度。也就是说机器生产的txt文件数据。

SPSS文件：软件自带的数据文件就是这种.sav文件。

dimensione： SPSS 的 Dimensions 软件保存文件。可从平面、表格 VDATA 格式或层级 HDATA 格式中的源读取调查数据。

SAS文件：适用于 Windows/OS2 的 SAS ( .sd2 ) UNIX 的 SAS ( .ssd ) SAS 传输文件 ( .tpt ) SAS 版本 7/8/9 ( .sas7bdat )

excel：适用于windows等系统.xls文件

用户输入：测试的时候，自己写的特定的数据。方便调试。也可以从流的任何非终端节点生成用户输入节点。

选择：可以使用选择节点，根据某个特定的条件选择或丢弃数据流中的部分记录。双击后，可以用函数构建器来完成选择函数。选出前段特定的数据。

样本：另一个说法，叫抽样节点。顾名思义就是从整个样本中抽出特定的部分。随机抽取等。选择呢？是对数据特征选择。抽样呢？是对整个数据集进行的切割。

平衡：平衡是通过复制记录，然后根据指定的条件丢弃记录完成执行的。例如，假设某个数据集只有两个值（ low 或 high ），并且 90% 的观测值为 low ，而只有 10% 的观测值为 high 。很多建模技术处理此类偏置数据都有困难，因为它们倾向于只研究这些 low 的结果，而忽略 high 的结果（因为这些结果数目极少）。

汇总：数据合成，数据量减少，减少的方法也是数学方法，比如说求和。选择是丢失数据，汇总是合成数据。

RFM 汇总：通过近因、频数、货币 (RFM) 汇总节点，您可以利用客户的历史交易数据，去除所有无用的数据，然后将他们的所有剩余交易数据合并到一行并以唯一的客户 ID 作为关键字，从而列出他们最后一次与您交易的时间（近因），交易的次数（频数）以及这些交易的总值（货币）。

排序：只有两个选择升序和降序。

合并：采用多个输入记录，然后创建一个包含全部或其中部分输入字段的输出记录。一般是两个文件的合并。

追加：是两个一样的数据表格，合成一个的过程。

区分：删除重复的记录，方法是，将第一个区分记录传递到数据流，或丢弃第一个记录而将任何重复记录传递到数据流。