我遇到了一些问题后的测试(包‘emMeans’,函数‘emMeans’/‘对比’)生存模型(包‘生存’,函数‘survreg’),我以前适应了一些实验数据.本试验用细菌或盐分处理4代紫花苜蓿植株.每种可能的治疗组合都有6个重复.丢失的值源于丢失的样本.

紫花苜蓿世代:G1、G2、G3、光环

盐度:0,8

细菌:C、CN、E、H、H+E

数据子集(仅显示一种细菌处理):

Bac Salinity    Generation  PRC MPR
E   0                 G1    0   6.761500689
E   8                 G1    1   N/A
E   0                 G2    0   6.761500689
E   8                 G2    0   6.761500689
E   0                 G3    1   6.67360118
E   8                 G3    0   6.761500689
E   0                Halo   0   6.761500689
E   8                Halo   0   6.761500689

T8PSR是我的数据,‘MPR’是脯氨酸含量,‘PRC’是0=已审查/1=未经审查的识别符.对于许多样本(特别是处理细菌=‘E’、细菌=‘H+E’和盐度=‘8’),响应变量(‘MPR’即,脯氨酸含量)是右审查的,因为我使用的分光光度计不能给出吸光度>3(这转化为脯氨酸浓度/‘MPR’值>6.76).

代码:

s2<-Surv(T8PSR$"MPR",T8PSR$"PRC", type="right")
P2<-survreg(s2~Bac*Generation*Salinity, data=T8PSR)
pa2<-anova(P2)
Prr<-emmeans(P2, ~Bac)
contrast(Prr, method="pairwise")

方差分析

                        Df Deviance Resid. Df  -2*LL Pr(>Chi)    
NULL                                      183 661.90             
Bac                      4  27.9079       179 634.00    <0.01 
Generation               3   1.1563       176 632.84    0.76   
Salinity                 1  27.8662       175 604.97    <0.01 
Bac:Generation          12   3.9519       163 601.02    0.98    
Bac:Salinity             4   7.4869       159 593.53    0.11    
Generation:Salinity      3   2.9534       156 590.58    0.39    
Bac:Generation:Salinity 12   4.2484       144 586.33    0.97    

Survreg/EMMeans给出了令人满意的结果,但在某些处理中,细菌根部Pro含量(显示)和盐度(未显示)的EMMeans估计的可信区间很大(我相信这是因为根中的审查数据比地上部中的数据更多):

 Bac emmean      SE  df  lower.CL upper.CL
 C    1.488   0.239 144     1.015     1.96
 C+N  1.517   0.256 144     1.012     2.02
 E    4.979 763.340 144 -1503.819  1513.78
 H    0.688   0.218 144     0.257     1.12
 H+E  4.786 763.340 144 -1504.012  1513.58

我的问题是:细菌处理之间的对比没有发现显著差异,尽管‘E’和‘H+E’的平均值要比其他处理高得多,而且比其他处理更严格(因此,脯氨酸含量明显更高).

 contrast      estimate       SE  df t.ratio p.value
 C - (C+N)      -0.0294    0.350 144  -0.084  1.0000
 C - E          -3.4913  763.340 144  -0.005  1.0000
 C - H           0.8001    0.324 144   2.471  0.1031
 C - (H+E)      -3.2981  763.340 144  -0.004  1.0000
 (C+N) - E      -3.4619  763.340 144  -0.005  1.0000
 (C+N) - H       0.8295    0.336 144   2.469  0.1035
 (C+N) - (H+E)  -3.2687  763.340 144  -0.004  1.0000
 E - H           4.2914  763.340 144   0.006  1.0000
 E - (H+E)       0.1932 1079.525 144   0.000  1.0000
 H - (H+E)      -4.0982  763.340 144  -0.005  1.0000

我如何通过"对比"来显示我所知道的明显有意义的结果?

我已经判断了堆栈溢出,但没有找到类似的问题(但是,如果我错过了,请直接告诉我一个).我已经翻阅了"emans"和"survreg"的说明,但也没有找到任何涉及这个问题的material .

推荐答案

整合 comments 讨论:

  1. 你正在拟合与对数挂钩的威布尔概率,这是survreg::survreg的默认概率.这是生存时间(通常严重向右倾斜,威布尔是指数分布的推广)的合理缺省值,但不适用于您的数据.转换为(对数)正态似然比显著提高了适合度.
  2. 您的模型相当复杂,使用三向交互解释并不简单(尽管您没有显示参数估计本身),并且增加了过度拟合的风险.专注于更简单的效应--go 掉一些更高阶的相互作用--会产生更好的、更容易解释的拟合.

还有一件事要做,就是实际确认模型的拟合优度,这是一个参数审查模型,他们往往比非审查模型对假设(同方差)更敏感.判断你的残差或预测与观察的结果!

R相关问答推荐

从API中抓取R数据SON

在边界外添加注释或标题

如何 bootstrap glm回归、估计95%置信区间并绘制它?

Highcharter多次钻取不起作用,使用不同方法

删除列表中存储的数据帧内和数据帧之间的重复行

如何根据R中其他列的值有条件地从列中提取数据?

R根据条件进行累积更改

在另存为PNG之前隐藏htmlwidget绘图元素

以更少间隔的较小表中的聚合离散频率表

如何同时从多个列表中获取名字?

我正在努力用R计算数据集中的中值逐步距离

用两种 colored颜色 填充方框图

在R函数中使用加号

以NA为通配符的R中的FULL_JOIN以匹配其他数据中的任何值.Frame

如何在反曲线图中更改X标签

为R中的16组参数生成10000个样本的有效方法是什么?

根据排名的顶点属性调整曲线图布局(&Q)

GgHighlight找不到它创建的列:`Highlight..1`->;`Highlight.....`

残差与拟合图上标记点的故障排除

R中刻面网格中的排序条形图