SPSS处理单元素,多元素logistic,详细流程和操作截图
统计结果:
- Binary logistic:单变量模型(针对各个变量)
LOGISTIC REGRESSION VARIABLES 脑白质高信号程度
/METHOD=ENTER 高分辨斑块(填入每个变量名就可以得到)
/PRINT=CI(95)
/CRITERIA=PIN(0.05) POUT(0.10) ITERATE(20) CUT(0.5).
方程中的变量 |
|||||||||
|
|
B |
S.E. |
Wald |
df |
显著性 |
Exp(B) |
EXP(B) 的 95.0% C.I. |
|
|
|
下限 |
上限 |
||||||
步骤 1a |
年龄 |
.065 |
.024 |
7.318 |
1 |
.007 |
1.067 |
1.018 |
1.118 |
常量 |
-4.007 |
1.432 |
7.829 |
1 |
.005 |
.018 |
|
|
|
a. 在步骤 1 中输入的变量: 年龄. |
|
|
|
|
|
|
方程中的变量 |
|||||||||
|
|
B |
S.E. |
Wald |
df |
显著性 |
Exp(B) |
EXP(B) 的 95.0% C.I. |
|
|
|
下限 |
上限 |
||||||
步骤 1a |
高血压病史 |
2.462 |
.608 |
16.378 |
1 |
.000 |
11.724 |
3.559 |
38.620 |
常量 |
-1.910 |
.536 |
12.703 |
1 |
.000 |
.148 |
|
|
|
a. 在步骤 1 中输入的变量: 高血压病史. |
|
|
|
|
|
|
方程中的变量 |
|||||||||
|
|
B |
S.E. |
Wald |
df |
显著性 |
Exp(B) |
EXP(B) 的 95.0% C.I. |
|
|
|
下限 |
上限 |
||||||
步骤 1a |
糖尿病(1) |
-1.655 |
.481 |
11.834 |
1 |
.001 |
.191 |
.074 |
.491 |
常量 |
.693 |
.354 |
3.844 |
1 |
.050 |
2.000 |
|
|
|
a. 在步骤 1 中输入的变量: 糖尿病. |
|
|
|
|
|
|
方程中的变量 |
|||||||||
|
|
B |
S.E. |
Wald |
df |
显著性 |
Exp(B) |
EXP(B) 的 95.0% C.I. |
|
|
|
下限 |
上限 |
||||||
步骤 1a |
mRs评分 |
.456 |
.200 |
5.195 |
1 |
.023 |
1.577 |
1.066 |
2.334 |
常量 |
-1.534 |
.631 |
5.915 |
1 |
.015 |
.216 |
|
|
|
a. 在步骤 1 中输入的变量: mRs评分. |
|
|
|
|
|
|
方程中的变量 |
|||||||||
|
|
B |
S.E. |
Wald |
df |
显著性 |
Exp(B) |
EXP(B) 的 95.0% C.I. |
|
|
|
下限 |
上限 |
||||||
步骤 1a |
高分辨斑块 |
3.013 |
.572 |
27.727 |
1 |
.000 |
20.357 |
6.631 |
62.495 |
常量 |
-1.692 |
.411 |
16.916 |
1 |
.000 |
.184 |
|
|
|
a. 在步骤 1 中输入的变量: 高分辨斑块. |
|
|
|
|
|
|
我只列了5个变量,如有需要可以把所有感兴趣的变量都算一遍。
对于logistic回归,单因素分析结果和成组基线资料比较的 t-test, Chi-square test, Fisher's exact test, Mann-whitney U test意义是一样的,都是单因素分析。所以你之前做的单因素分析和现在这个单因素的logistic回归的结果基本一致。根据需求选择其一,也可以都列出来。
这个表做的就是两组(根据WMH分组)之间各个变量的分布对比,使用了t-test和Chi-square test来检验各个变量和WMH之间的关系。结果和单因素logistic回归一致,都是发现年龄,mRs,高血压,糖尿病,肿块和WMH有显著相关性,然后在下一步建立多因素logistic回归。
- 在统计学上,在建模之前应当判断各个变量是否满足前提假设,包括检验模型中是否存在强多重共线性。
相关矩阵 |
|||||||
|
|
Constant |
年龄 |
高血压病史(1) |
糖尿病(1) |
mRs评分 |
高分辨斑块(1) |
步骤 1 |
Constant |
1.000 |
-.798 |
.061 |
-.178 |
-.156 |
-.264 |
年龄 |
-.798 |
1.000 |
-.194 |
-.168 |
-.334 |
-.002 |
|
高血压病史(1) |
.061 |
-.194 |
1.000 |
-.077 |
-.099 |
.379 |
|
糖尿病(1) |
-.178 |
-.168 |
-.077 |
1.000 |
.218 |
.224 |
|
mRs评分 |
-.156 |
-.334 |
-.099 |
.218 |
1.000 |
-.076 |
|
高分辨斑块(1) |
-.264 |
-.002 |
.379 |
.224 |
-.076 |
1.000 |
相关系数的绝对值越接近1说明线性相关越强,正数正相关,负数负相关。从相关系数矩阵来看,存在多重共线性的风险较小。
- Binary logistic:全模型
多因素分析自变量的选择应该首先应该受样本量的限制。然后遵循专业选择的要求,即医学上合理的分析才作, 没有实际意义的自变量不能放进去。过了这一步,如果自变量数目仍然过多,才可以通过统计学的方法来协助筛选,即单因素分析显著的才进入多因素模型(其实是按照单因素分析的P值有效到达来选)。所以我们将五个在单因素分析显著的变量一起放入logistic回归模型。
方程中的变量 |
|||||||||
|
|
B |
S.E. |
Wald |
df |
显著性 |
Exp(B) |
EXP(B) 的 95.0% C.I. |
|
|
|
下限 |
上限 |
||||||
步骤 1a |
年龄 |
.043 |
.036 |
1.483 |
1 |
.223 |
1.044 |
.974 |
1.120 |
高血压病史(1) |
-2.735 |
.879 |
9.668 |
1 |
.002 |
.065 |
.012 |
.364 |
|
糖尿病(1) |
-1.182 |
.750 |
2.486 |
1 |
.115 |
.307 |
.071 |
1.333 |
|
mRs评分 |
.285 |
.325 |
.769 |
1 |
.381 |
1.329 |
.704 |
2.512 |
|
高分辨斑块(1) |
-3.202 |
.784 |
16.700 |
1 |
.000 |
.041 |
.009 |
.189 |
|
常量 |
-.410 |
2.019 |
.041 |
1 |
.839 |
.664 |
|
|
|
a. 在步骤 1 中输入的变量: 年龄, 高血压病史, 糖尿病, mRs评分, 高分辨斑块. |
|
|
|
结果发现,年龄、糖尿病、mRs在多因素logistic中不再显著。可能的原因有:
- 几个变量之间存在相互作用
- 存在未知的混杂因素
- 样本量不够,不足以使得模型收敛
建议应该实事求是地汇报研究结果,不管结果是显著或者不显著。如有进一步需求可以做分层分析,进一步判别混杂因素是哪个。
PS:
表格已经画好了,只需要改数字就行了。
B = beta
SE = 标准误差
Wald = Wald 卡方
显著性 = p
Exp(B) =OR
95%CI = 95%OR
附:spss操作流程(以你的数据为例)
步骤一:选择数据
步骤二:单变量logistic,以st2为例,重复(也可使用代码easier)
LOGISTIC REGRESSION VARIABLES 复发
/METHOD=ENTER st2
/CRITERIA=PIN(.05) POUT(.10) ITERATE(20) CUT(.5).
步骤三:多变量logistic, 模型选择根据实际应用,多试