R教材7 方差分析

  1. 方差分析:组间差别分析aov(formula,data),将组别因子加入到函数
  2. 双因素方差分析中,若不同的分组中组内观测数不同则模型的顺序具有唯一性;ANOVA模型的顺序很重要,模型Y~A+B+A:B,其中Y为因变量,A,B为分组量
    1. 序贯型:后面对线出现的效应做调整,A不调整,B根据A调整,A:B交互项根据A和B调整
    2. 分层型:根据同水平或低水平的效应调整,A根据B调整,B根据A调整,A:B交互项同时根据A和B调整
    3. 边界型:每个效应根据模型其他各效应做效应调整,A根据B和A:B调整...
    4. R中默认序贯型,其他软件或car::Anova()默认边界型
  3. 正确的模型顺序:协变量+主效应+双因素交互项+三因素交互项,越基础性的变量越在前;但首先因子之间不是完全相关的
  4. *table(x),分组属性的频数;aggregate(y,by=list(x),FUN=mean),对每组的y函数操作
  5. 单因素方差分析aov(y~x),summary
    1. plotmeans(y~x),绘制各组均值和置信区间
    2. 多重比较TukeyHSD(mod),plot(TukeyHSD(mod)),对多重比较作图
      1. multcomp::glht(mod,linfct=mcp(x="Tukey")),对x分类因子进行多重比较的方法选择;summary(glht(...))
    3. 检验假设条件
      1. 正态性:qqPlot(lm(y~x,data)),qqPlot()必须用lm拟合模型
      2. 方差齐性:bartlett.test(y~x,data),H0:同方差
      3. 离群点:方差齐性对离群点非常敏感,car::outlierTest(mod),当p>1时将产生Bonferonni p:NA
  6. 单因素协方差分析:包含定量的协变量
    1. 控制协变量
      1. 去除协变量效应后的组均值,effects::effect("单因素分类因子",mod)
    2. 多重比较multcomp::glht(mod,linfct=mcp(x=))
      1. constrast=rbind("no drug vs. drug"=c(3,-1,-1,-1));summary(glht(fit1,linfct=mcp(dose=constrast))),设定第一组和其他三组的均值进行比较
    3. 检验假设条件
      1. 正态性:qqPlot(lm(y~x,data))
      2. 方差齐性:bartlett.test(y~x,data)
      3. 不同分类因子的回归斜率相同,当模型包含协方差和分类因子的交互项时,可对回归斜率的同质性进行检验,H0:斜率相等,斜率不等则说明出现了交互作用,summary交互项的显著性,不显著则说明斜率相等;而斜率不等:
        1. 变换协变量或因变量
        2. 使用能对每个斜率独立解释的模型
        3. 使用不需要假设回归斜率相等的非参数ANCOVA方法,sm::sm.ancova()
    4. 结果可视化HH::ancova(formula,data),可查看斜率同质性和组间差异
  7. 双因素方差分析
    1. 确认因素都为因子,factor()
    2. aov(y~A*B),A*B=A+B+A:B
    3. 可视化
      1. interaction.plot(A, B,y, type="b"),展示双因素方差分析的交互效应
      2. HH::interaction2wt(formula),展示任意顺序的因子设计的主效应和交互效应,直接看交互图,自身图表示该分组因子的主效应的箱型分布图
    4. *当每组的样本量相同时,不用考虑效应顺序的影响
  8. 重复测量方差分析:受试者被测量不止一次,关注组内因子和组间因子
    1. 确认因素都为factor
    2. aov(y~B*W+Error(subject/(W)),data),重复测量产生每个组内的差异,即Error(对象/组内因子)
    3. *在重复测量的设计中,数据结构必须是长格式的数据才能拟合模型,长格式中因变量的每次测量都要放在特定的行中,reshape包可以转换格式
  9. 多元方差分析:当因变量多个时,用多元方差分析MANOVA
    1. 确认分组因素为因子
    2. 将因变量合并为一个矩阵,manova(y~x),summary.aov(mod)再对每个因变量做单因素方差分析
    3. 评估假设检验
      1. 多元正态性:因变量组合成的向量服从一个多元正态分布
      2. 方差-协方差矩阵同质性
      3. 多元离群点:mvoutlier::aq.plot(y)
    4. 稳健多元方差分析:非参数方法的MANOVA检验,不需要考虑前提假设,对前提假设不敏感,rrcov::Wilks.test(y,x,method="mcd")
  10. 回归解决方差分析问题lm(formula,data,contrasts="")
    1. R处理类别型变量:类似于将因子作多选题选项的变化
      1. contr.helmert:第二个水平对照第一个水平,第三个水平对照前两个水平的均值
      2. contr.poly:基于正交多项式的对照
      3. contr.sum:对照变量之和为0
      4. *contr.treatment:默认第一个水平为各水平对照基线水平
      5. contr.SAS:以最后一个水平为基线水平,类似于大部分SAS过程中使用的对照变量

猜你喜欢

转载自blog.csdn.net/u013103305/article/details/83409554