1、建模步骤
模型的建立:当有两个模型套用时,说的高端点,说成是前两个字组合后新名字的算法,其实是两个模型的叠加
模型的分析:表层的分析(从图表中能够看出什么)+深层次的分析
模型的检验:例如,给100年数据预测未来10年数据,我们可以将数据按照7:3的比例拆分,用70的来预测未来30年的数据,然后两个30年来做精度比较。用已知数据去检验预测或评价的数据,得到一个精度系数或者误差因子,再带入模型求解或未来预测中。
2、数学建模问题
1.数据处理 2.关联与分析 3.分类与判别 4.评价与决策 5.预测与预报 6.优化与控制
(1)数据处理问题
•①插值拟合
•主要用于对数据的补全和基本的趋势分析
•②小波分析,聚类分析(高斯混合聚类,K-均值聚类等等)
•主要用于诊断数据异常值并进行剔除
•③主成分分析、线性判别分析、局部保留投影等
•主要用于多维数据的降维处理,减少数据冗余
•④均值、方差分析、协方差分析等统计方法
•主要用于数据的截取或者特征选择
(2)关联与因果
•①灰色关联分析方法(样本点的个数较少)
•②Superman或kendall等级相关分析
•③Person相关(样本点的个数比较多)
•④Copula相关(比较难,金融数学,概率密度)
•⑤典型相关分析(因变量Y1234,自变量组X1234,各自变量组相关性比较强,问哪一个因变量与哪一个自变量关系比较紧密?)
(3) 分类与判别
•①距离聚类(系统聚类)常用
•②关联性聚类(常用)
•③层次聚类
•④密度聚类
•⑤其他聚类
•⑥贝叶斯判别(统计判别方法)
•⑦费舍尔判别(训练的样本比较少)
•⑧模糊识别(分好类的数据点比较少)
(4)评价与决策
•①模糊综合评判:评价一个对象优、良、中、差等层次评价,评价一个学校等,不能排序
•②主成分分析:评价多个对象的水平并排序,指标间关联性很强。
•③层次分析法:做决策,通过指标,综合考虑做决定
•④数据包络(DEA)分析法:优化问题,对各省发展状况进行评判
•⑤秩和比综合评价法:评价各个对象并排序,指标间关联性不强
•⑥神经网络评价:适用于多指标非线性关系明确的评价
•⑦优劣解距离法(TOPSIS法)
•⑧投影寻踪综合评价法:糅合多种算法,比如遗传算法、最优化理论
•⑨方差分析、协方差分析等
• 方差分析:看几类数据之间有无差异,差异性影响,例如:元素对麦子的产量有无影响,差异量的多少;(1992年作物生长的施肥问题)
协方差分析:有几个因素,我们只考虑一个因素对问题的影响,忽略其他因素,但注意初始数据的量纲以及初始情况。(2006年,艾滋病疗法的评价以及预测问题
(5)预测与预报
•主要有五种:
•小样本内部预测-回归拟合(内部预测,如用身高 体重得预测性别)
•大样本的内部预测-逻辑回归
•小样本的未来预测-灰色预测(外部预测:用前10年预测第十一年)
•大样本的随机因素或周期特征的未来预测-时间序列
•大样本的未来预测-神经网络,小波神经网络
•①灰色预测模型(★)
• 满足两个条件可用:
• a数据样本点个数少,6-15个
• b数据呈现指数或曲线的形式
•②微分方程预测(备用)
• 无法直接找到原始数据之间的关系,但可以找到原始数据变化速度之间的关系,通过公式推导转化为原始数据之间的关系。
•③回归分析预测(★)
• 求一个因变量与若干自变量之间的关系,若自变量变化之后,求因变量如何变化;
• 样本点的个数有要求:
• a自变量之间协方差比较小,最好趋于零,自变量间的关系小;
• b样本点的个数n>3k+1,k为自变量的个数;
• c因变量要符合正态分布
•④马尔科夫预测(备用)
• 一个序列之间没有信息的传递,前后没有联系,数据与数据之间随机性强,相互不影响;今天的温度与昨天、后天没有直接联系,预测后天温度高、中、低的概率,只能得到概率
•⑤时间序列预测(★)
• 与马尔科夫预测互补,至少有2个点需要信息的传递,ARMA模型,周期模型,季节模型等。
•⑥小波分析预测
•⑦神经网络预测
•⑧混沌序列预测
(6)优化与控制
•①线性规划、整数规划、0-1规划(有约束,确定的目标)
•②非线性规划与智能优化算法
•③多目标规划和目标规划(柔性约束,目标含糊,超过)
•④动态规划
•⑤图论、网络优化(多因素交错复杂)
•⑥排队论与计算机仿真
•⑦模糊规划(范围约束)
•⑧灰色规划(难)