数学建模
2023-02-16 20:22:31 24 举报
AI智能生成
美赛准备总结
作者其他创作
大纲/内容
评价类模型
层次分析法(AHP)
适用:做决策、选出比较好的方案
流程:见清风PPT 62页:建立层次结构——判断矩阵——权重矩阵及一致性检验——计算得分并排序
局限性
决策层不能太多(即方案不能太多),否则判断矩阵和一致矩阵差异过大
决策层数据已知的话,可以更准确,即TOPSIS
模糊综合评价(可分级)
定义:在模糊环境下,考虑了多因素的影响,为了某种目的对一事物作出综合决策的方法。
适用:各种非确定性问题的解决,有结果清晰,系统性强的特点,能较好地解决模糊的、难以量化的问题
流程:建立综合评价的因素集(具有模糊性)——评价集——确定各因素的权重(无数据层次分析法,有数据可熵权法)——单因素模糊综合评价,获得评价矩阵(需计算隶属度)——综合评价模型——得分
TOPSIS
定义:可翻译为逼近理想排序法,即优劣解距离法,能利用原始数据的信息,精确反映个评价方案之间的差距
适用:指标有具体数值,且①比较对象远大于2;②比较指标大于1;③一些指标不存在理论上的最大值与最小值
流程:正向化、标准化——找到最优与最劣方案——计算与最优方案的距离——归一化、得出排名
带权重的TOPSIS推荐“基于熵权法的TOPSIS模型”
主成分分析(PCA)
适用:较少的新变量替换原来较多的新变量,而且是这些较少的新变量尽可能多地保留原来所反映的信息
SPSSPRO什么的都可以作出结果
方差分析、协方差分析(F检验)
适用:通过数据分析找出对事物有显著影响的因素,各因素之间的交互作用,以及显著影响因素的最佳水平等
分为:1、多个样本均数间两两比较、多个实验组与一个对照组均数间两两比较
秩和比综合评价法
特点:评价各个对象并排序,指标间关联性不强
规划、优化类模型(概念简单,不赘述)
线性规划
非线性规划
0-1规划
有确定的目标
多目标规划
动态规划
模糊规划
划定一个范围(将线性规划的范围模糊)
排队论与计算机仿真
图论
神经网络
现代优化算法(蚁群、模拟退火、遗传、禁忌搜索算法等)
预测类模型
灰色预测模型
使用条件
数据样本点少,6-15个
数据呈现指数或曲线形式
基本思想与流程见评价类中的灰色关联分析
回归预测
使用条件
求一个因变量与若干自变量之间的关系
自变量间的相关性小,因变量要符合正态分布
样本点的个数n>3k+1
优缺点
时间序列预测
AR
MA
ARMA
周期模型
季节模型
马尔科夫预测
使用条件
一个序列之间没有信息的传递,前后没联系,数据与数据之间随机性强,相互不影响
优缺点
神经网络预测
使用条件
大量的数据,不需要模型,只需要输入和输出
微分方程预测
使用条件
无法直接找到原始数据之间的关系,但可以找到原始数据变化速度之间的关系,通过公式推导转化为原始数据的关系。
优缺点
小波分析预测
使用条件
数据无规律,海量数据,将波进行分离,分离出周期数据、规律性数据;
可以做时间序列做不出的数据,应用范围比较广
优缺点
分类与判别
系统聚类
做法:开始时把每个样品作为一类,然后把最靠近的样品(即距离最小的群品)首先聚为小类,再将已聚合的小类按其类间距离再合并,不断继续下去,最后把一切子类都聚合到一个大类。
需确定:类间距离和样本件距离
SPSS就能做
K-means聚类
1.先随机选择一个聚类中心,
2.剩余的各自聚类(聚类的类数k应实现给出),每个数据点通过计算点和每个组中心之间的距离进行分类,然后将这个点分类为最接近它的组。
3.给每一类取均值(按属性值取平均),
4.若与初始新选择的聚类中心不同,则将所得均值作为新的聚类中心,进行二次分类
5.数值均值易受到极端值影响,因此需要事先进行标准化
2.剩余的各自聚类(聚类的类数k应实现给出),每个数据点通过计算点和每个组中心之间的距离进行分类,然后将这个点分类为最接近它的组。
3.给每一类取均值(按属性值取平均),
4.若与初始新选择的聚类中心不同,则将所得均值作为新的聚类中心,进行二次分类
5.数值均值易受到极端值影响,因此需要事先进行标准化
密度聚类
本质上就是基于一种密度的概念来进行聚类,而密度的定义本质上也是来自于两点的距离
贝叶斯判别
实际上是对样本空间进行分类,基本准则是使得错判损失达到最小。
优势:不怕噪声和无关变量;劣势:它假设各特征属性之间是无关的
费歇尔判别
“投影”,即将高维空间的点向低维空间投影,从而简化问题进行处理。
关联与因果
灰色关联分析
基本思想:通过确定参考数据列和若干个比较数据列的几何形状相似程度来判断其联系是否紧密,它反映了曲线间的关联程度
用途:分析各个因素对于结果的影响程度,也可以运用此方法解决随时间变化的综合评价类问题
流程:确定分析数列——标准化——计算关联系数和关联度——关联度排序
Person相关
样本点的个数比较多
典型相关分析
因变量组Y1234,自变量组X1234,各自变量组相关性比较强,问哪一个因变量与哪一个自变量关系比较紧密
标准化回归分析
这个我们都很熟悉l
生存分析(事件史分析)
适用:数据里面有缺失的数据,哪些因素对因变量有影响
定义:一系列用来探究所感兴趣的事件的发生的时间的统计方法(比较复杂)
常见的有1)癌症患者生存时间分析2)工程中的失败时间分析
因果推断
PSM-DID
收藏
0 条评论
下一页