数模
文献查找
google scholar(不建议)、springer、中国知网
资料搜寻
CSDN、知乎、百度文库
黑科技工具
篡改猴、sci-hub(用来查论文)、大木虫(谷歌镜像站)
电子书
学兔兔、巧咪网、学研谷、鸠摩搜索
层次分析法
对评价类问题进行打分。
首先确定三个问题:评价目标、评价标准、可供选择选项。
确定权重指标时,可先两两比较,在上一组比较基础上推断当前两组的权重。
可确定一个判断矩阵:(aij)n*n
其中aij代表i指标相较于j指标的重要程度。
是要通过相互比较确定各准则对目标的权重,及个方案对每一准则的权重(定量的),将方案层对准则层权重及准则层对目标层权重综合确定最终方案层对目标层权重
一致阵的性质:1.秩为1,在矩阵每个值确定的情况下,每一行都与第一行成比例,则唯一非零特征根为n(可计算得出:|A-入E| = 0);2.矩阵任一列都为特征根n的特征向量。
称有如下性质:aij*aji = 1的矩阵为正互反矩阵,当正互反矩阵不为一致阵时,其最大特征根大于n且与n相差越大,不一致程度越大。
一致性检验方法:一致性指标:CI = (λmax - n) / (n - 1):1.0,完全一致性;2.接近0,满意的一致性;3.越大则一致性越差。
引入随机一致性指标RI来衡量CI:RI = (多个判断矩阵求一致性指标后的平均值)。
一致性检验方法:一致性比例:CR=CI/RI,(注意此处RI通过查表可得)若CR<0.1,可认为判断矩阵一致性可接受;否则需要进行修正,即强行调整,往倍数上靠即可。
对非一致性矩阵,由于各列不成比例,则计算每一列的权重,然后算出均值即可作为最后的权重。
论文表述
(注意此处公式有误,应该是计算每一列的权重比例,参考文字表述即可)。
也可以使用特征值求特征向量的方法来求解权重。
最终判断图:
总结
注意
实际题目中,需要自行查询相关数据支持,一般采取网上搜集材料(论文)或调查问卷来进行判断。
Matlab
常用操作
sum(E, 1)
按列求和;sum(E, 2)
按行求和。E(:)
:取出矩阵的所有列并将每一列从上至下拼接成一列,最后形成一个列向量。E(i,j)
返回矩阵第(i,j)个元素。E([1,3],:)
取第1、3的全部元素。E(1:3,:)
取1-3行的全部元素。E(1:2:3, :)
取第一行和第三行(从1开始,每次递增2行,到3结束)。E(end,:)
输出矩阵最后一行的所有元素。
repmat
函数
B=repmat(A,m,n):将A复制m*n块,即将A作为B的元素,后者由mn个前者组成。
inv(E)为E的逆矩阵。
两个形状相同的矩阵对应元素间的乘除法:.*
和./
E.^2
得到的结果是E中每个元素分别平方。
求特征值和特征向量
eig(E)
为矩阵E
的全部特征值,将返回一个由特征值组成的向量。[V,D]=eig(A)
求矩阵A
的全部特征值,构成对角阵D
,并求A
的特征向量构成V
的列向量,V
中每一列都是D
中与之相同列的特征值的特征向量。
讲述方式
论证为什么要用启发式算法,比如问题规模较大,正常方法比较难以获得答案,因而使用启发式算法。
蒙特卡洛方法
UCT值,
博弈论
理性行为、利益最大化
非合作博弈(经济学上常研究,较为简单)
完全信息的静态博弈(囚徒困境)
静态:博弈双方都不知道对方的抉择,且该抉择一定情况下不会改变。
个人利益最优!=集体利益最优
纳什均衡:若任意参与者在其他所有参与者的策略确定下,其选择策略最优,则该组合被定义为纳什均衡。
用划线法寻找:即分别在对方策略确定的情况下来抉择选择的策略并相应划线,最终都划线的联合策略即为相应的纳什均衡。
对于混合策略(即不是一比一进行两项抉择,而是有一定概率的进行时,列出利益表达式并使之最大化,画出相应的策略曲线,两曲线交点即为纳什均衡点)
完全信息的动态博弈
参与者行动有顺序,使用博弈树来表示。
子博弈精炼纳什均衡:1.策略组合为整个博弈的纳什均衡;2.策略组合相关行动规则在每个子博弈上都是纳什均衡。
使用逆向归纳法来寻找。从最后的决策者依次向上进行最优选择。最后剩下的即为子博弈精炼纳什均衡。
元胞自动机
元胞空间:一群元胞;摩尔邻居:元胞上下左右,左上下和右上下;冯诺依曼领域:元胞上下左右。
对于边界元胞:给定虚拟的邻居:固定型(给一个固定的数)、周期型(将元胞立体起来,形成循环的形式:123
例如1d的左邻居为3,3右邻居为1)、绝热型(自己是多少,邻居是多少)、映射型(将不存在的邻居通过对称得到,例如:1234
中1的左邻居即为3)。
粒子群算法
其中三种速度由当前速度、个体最优影响和群体最优影响所共同决定。
w为惯性权重,c1、c2分别为个体、全局学习系数,c1r1(t)表示个体学习移动步长、c2r2同理,pij为个体极值位置,pgj为全局极值位置。
流程:
优点:易于实现、参数少、原理简单
缺点:早期易早熟、陷入局部最优;后期迭代速度过慢。
对于固定参数的标准算法进行改进:w前期大一些,便于搜索整个区域,后期小一些,多向其他粒子学习。c1前期大一些,c2后期大一些,进而平衡粒子全局搜索能力和局部搜索能力;引入随机因素,对速度、位置的边界发生改变:如后期压缩最大速度等、结合其他智能优化算法:遗传算法、模拟退火等跳出局部最优,改善收敛速度。
非线性方程求解
数据拟合
拟合图像,来实现插值和预测。
拉格朗日多项式
拟合的唯一存在定理:至多(n - 1)多项式函数一定可以经过n个数据点(前提是这n个数据点的横坐标都不相等)。
拉格朗日多项式函数:
虽过每个数据点、有现成公式,但是将产生过拟合、数据边界会形成震荡,难以看出数据趋势。
三阶样条
利用二次函数顺次连接3个数据点(xi,yi)(i=1、2、3):
假设:(x1,y1)、(x2,y2)在S1(x)上,另外两点在S2(x)上,要确保每段的连接处光滑、不间断、无”尖点”、无”凹凸性突变”,联立方程求解(过点列出4个方程、无尖点列出一阶导相等、凹凸性无突变列出二阶导相等)
推广到n个数据点的情况,若仍使用二次函数来顺次连接,则会出现在n>3时,方程数多于未知数个数的情况,此情况下一般没有解,因此,考虑使用三次函数来顺次连接n个数据点,则会有(4n-4)个未知数,方程个数不变仍是(4n-6)个,还差两个,考虑灵活度和边界条件:即规定最左右侧的点的一阶导或二阶导同时满足一定条件。
优点:拟合函数过每个数据点、计算过程解线性方程组、可通过控制边界条件灵活得到不同环境下所需拟合曲线、且不像拉格朗日多项式会在数据端点处产生弹出效果。
缺点:拟合函数为分段函数不易迭代计算、无法反映数据整体趋势、由于边界人为指定,难以实现预测、同样会有过拟合现象的存在。
最小二乘法
对于非线性拟合可以使用线性化方法,例如:对于求e
指数函数形式的非线性拟合时(y = e^(ax+b)
),可以两边先ln
一下,得到u=lny = av + b
的形式,进而得到线性的形式,再使用最小二乘的方式求解。
优点:反应综合趋势、有强几何意义、统计意义;
缺点:难以选取函数型,对含有指数和对数型的拟合函数难以计算参数
人口模型
基本假设:
- 人口数随时间连续变化且可导
- 人口增长和生育率和死亡率相关,同时还受资源总量限制
符号约定
人口数P(t)
(万人)、单位时间出生率a
、单位时间死亡率b
、资源所允许的人口数量上线M
P(t) = (a-b)P(t)(a>b) ,令k = (a-b),则由于资源限制:k=ρ(M-P(t))(ρ>0) 则P
(t) = ρ(M-P(t))P(t)
解出微分方程的解:P(t) = (C0*M) / (C0 + e^(-Mρt)),图像类似于生物学中的种群数量变化S图像,增长速度在数量达到(s/2)时达到最大值。
离散化:通过极限的定义:P(t) = lim((P(t+Δt) - P(t))/Δt), 则下式近似成立:P
(n) ≈ P(n+1) - P(n)(n∈Z)
则有P(n + 1) - P(n) = ρ(M -P(t))P(t)
可以利用该式通过最小二乘或者插值法来预测未来的数据。(例如:过往多个年份的人口数来预测下一年的人口数)
模糊综合评价
模糊
不满足“非此即彼”的排中律,具有“亦此亦彼”的模糊性的现象。
模糊集合
不具有传统集合的互异性。
蚁群算法
模拟退火
做出抉择后,根据结果进行M算法判断:符合目标百分之百接受;不符合目标有一定概率p接受(该概率p满足一定的公式:p=e^((f-f_new)/T)
,即p = e^(-ΔE/T)
)。
从某一较高“初温”开始,伴随着温度的不断下降,结合概率突跳特性,在解空间内“随机寻找”目标函数的”全局最优解”,即能概率性跳出局部最优解。
多次升-降温中,可得固定温度T0下一系列不同的能量,则能量最低的情况即为全局最优。
前期找到更多的新区域,后期找到局部最优解。
温度越高,接受“错误解”的概率越高,步长越大;越低,接受概率越低,步长越小。
可以应用为优化问题,如图论中最短路径问题和线性\非线性规划问题。
遗传算法
- 交配->繁衍后代:遗传、变异
- 自然选择(适应度)
常见应用: - 寻路问题
- 囚徒困境
- 找多边形的圆心
- TSP(旅行商问题)
- 生产调度
- 人工生命模拟
运筹学
线性规划
解决问题时先将一般的约束条件进行标准化,即转化为约束条件全为等式或大于等于0的式子。
对于不等式约束,可以采取添加工具变量Si,使之变为等式约束。例如:x3>=x2 =>x3-s1=x2(s1>=0)
对于无约束的变量xi,可以将其表示为:xi = xi+ - xi-
(xi+、xi->=0)
步骤
设出决策变量x->写出目标函数、约束条件
小技巧:对于max{min{x1,x2,x3…}}的目标函数,可以先假设y=min{x1,x2,x3,….},这样目标函数就变为了max{y}
,而多出了约束条件:y<=x1,y<=x2,....
好题
一家医院想制定周期一周的护士夜班值班表,要满足一下要求:
- 第j天要有dj个护士值夜班,j=1…7
- 每个护士连续值班5天
- 满足上述条件下,最小化值班护士人数
- 排班表中,对于所有护士来说,每周的排班都应该相同
主要是决策变量的选择,设xi为从周i开始值班的护士人数
那么,目标函数就变为了:min{Σxi}
,约束条件就是对于某一一天,至少值班的人数应该大于di,例如,对于,周一来说:当天至少有当天开始值班的x1、以及从上周四、五、六、天开始值班的x4、x5、x6、x7,一共,x1+x4+x5+x6+x7 >= d1
求解
图解法与基本可行解
基本可行解分为基本解和可行解,前者满足:1.在可行域内2.为极值点;后者代表了满足例如任意xi都要>=0的这种条件的解。
此处极值点的定义需要先介绍两个概念,即凸集和凸组合,其中前者定义如下:S∈R^n,S中的所有元素都满足连线线段上的点都在集合S中
,而后者则定义如下:S中的元素x1、...、xn
则凸组合为Σρixi,其中ρi>=0,Σρi = 1
极值点:若x0为S极值点,则无法从S中找到任意点,使其凸组合为x0.
单纯形法
先找到一个初始基本可行解,若满足最优性条件和可行性条件,则直接得到最优解;否则,进行改善:出基/进基(跳到其邻近的极点),并循环判断。
工具变量法
最优性条件:对于求最大值的问题需要检验数都非负;求最小值的问题则需要检验数都非正。因为检验数是当前目标函数的系数的相反数,因此对于求最大值问题,若检验数仍有负值则还有改进空间,还可以更大。
可行性条件:所有基变量都需要非负。
进基:将某个非基变量放入基变量组;
出基:将某个基变量踢出基变量组;
优先选取检验数绝对值最大的非基变量作为进基变量,此后对于出基变量,考虑aij>0
的(j是选择了进基的那一列,i是需要出基的每一行),并选取其中b'i/aij
最小的作为出基向量(b’i是此时i行中该基变量的解),因为只要若不选择最小的比值进行出基,则将会求出有的基向量比0小,不满足可行性条件。
对于基变量需要保持该列对应到与基变量相符的行的值要为1(通过矩阵的行变换实现),其余行都为0.
大M法
对于可能一开始无法很好的找到初始基本可行解的情况,可以在目标函数中减去一个乘上很大的数M
的松弛变量U1
,例如:max{z = 4x1+3x2-MU1}
,由于M极大,且可行性条件限制了只能取非负值,因此可以限制住U1
为0,而该U1
将添加到无法得到可行解的那一行中,此后正常计算,直到迭代出不含有U1
的基变量时即可,删去U1
并再继续正常计算,作用也就是帮助求解基本可行解。
两阶段法
弥补计算机中对于无穷大理解的欠缺,也就是因为M在计算机中表示是需要进行赋值的,而只要有赋值,就会有比其大的数。
第一个阶段将目标函数修改为求解新添加的新变量和的
最小值,然后正常计算,计算出基本可行解后,进入第二阶段转变目标函数为原始的目标函数继续计算后得到最终的解。
对偶问题
定理
互补松弛定理的启示:对于一些生产问题:影子价格为0的原材料不一定取等,影子价格不为0的原材料一定取等。
C题
问题一
按照双胎妊娠胎儿游离 DNA 比例及其影响因素研究的处理数据的方式,将BMI和孕周数划分为多个区间后,并在每个区间内取Y染色体浓度的均值,此后根据这些均值点建立线性回归模型,将相应的线性模型作为关系模型,根据F检验来判断显著性进而进行分析。
论文
Factors affecting the failure of non-invasive prenatal testing and the feasibility analysis of retesting
探讨无创产前检测(non-invasive prenatal testing,NIPT)失败的原因及重复检测的可行性。
对于BMI和DNA浓度的论述:cffDNA浓度还受孕妇体重或BMI的影响。大量的研究证实,孕妇体重或BMI与cffDNA浓度呈反比 [ 9 , 10 , 11 , 12 ]。Kinnings等 [ 9 ]发现,在20~40 kg/m 2的范围内,孕妇的BMI每增加5 kg/m 2,cffDNA浓度下降1.17%。其原因一方面是母体循环血容量大,导致cffDNA的占比被稀释,另一方面,母体脂肪细胞凋亡可能释放大量的游离DNA进入血循环,导致cffDNA被稀释,导致检测失败 [ 13 ]。因此,Livergood等 [ 14 ]建议,对于肥胖孕妇(BMI>35 kg/m 2),适当推后检测至孕21周对降低NIPT检测的失败率有一定的帮助。但由于会延迟胎儿非整倍体的诊断时间,NIPT检测的孕周越大,风险越高。因此,在检测前应充分告知肥胖孕妇NIPT检测失败的可能性及相关风险。此外,cffDNA浓度还可能受其他因素,如胎儿染色体非整倍体和试管妊娠等的影响 [ 15 , 16 , 17 , 18 , 19 ]。
基于Logistic回归分析探讨无创产前检查筛查失败的影响因素
基于Logistic回归分析探讨无创产前检查筛查失败的影响因素
无创产前检测技术的发展与应用
双胎妊娠胎儿游离DNA比例及其影响因素研究
箱线图、均值上下、
母体血浆中胎儿游离DNA定量及其在无创产前筛查中的应用
主要讲述了测定胎儿体内游离DNA的含量测量方法。