掌握多元logistic回归分析,看这篇就够了

掌握多元logistic回归分析,看这篇就够了01. 概念
多元 logistics 回归(multinomial logistics regression)⼜称多分类 logistics 回归。医学研究、社会科学领域中,存在因变量是多项的情况,其中⼜分为⽆序(⼝味:苦、甜、酸、辣;科⽬:
数学、⾃然、语⽂、英语)和有序(辣度:微辣、中辣、重辣)两类。对于这类数据需要⽤多元 logistics 回归。
多元 logistics 回归实际就是多个⼆元 logistics 回归模型描述各类与参考分类相⽐各因素的作
⽤。如,对于⼀个三分类的因变量(⼝味:酸、甜、辣),可建⽴两个⼆元logistics回归模型,分别描述酸味与甜味相⽐及辣味与酸味相⽐,各⼝味的作⽤。但在估计这些模型参数时,所有
对象是⼀起估计的,其他参数的意义及模型的筛选等与⼆元logistics类似。
02.条件
因变量:三个及以上分类变量⾃变量:分类或连续变量协变量:分类变量
03.案例及操作
【例】为了研究饮⾷⼝味偏好的影响因素,分析年龄、婚姻情况、⽣活态度在饮⾷⼝味类型偏
好(1=酸、2=甜、3=辣)中的作⽤,共挑选被试30⼈,结果见下表,试进⾏多元logistics回归。
说明:本案例数据纯属编造,结论不具有参考性和科学性,仅供操作训练使⽤。
⑴建⽴数据⽂件⼝味偏好,sav,见下图十六大常委见面会
每个被试有⼀个⼝味偏好因变量taste和3个⾃变量age、married、inactive。
⑵对⼝味偏好 taste 加权
单击【数据】→【加权个案】,打开加权个案对话框,加权⼝味偏好,见下图
(3)选择【分析】→【回归】→【多项logistics】,打开多项 logistics回归主对话框,见图。
【因变量】:分类变量,本例选择“taste”
【因⼦】:可选择多个变量作为因⼦,本例选择“age”、 “married”、“inactive”
【协变量】:可选择多个变量作为协变量,本例未选择
(4)单击【参考类别】按钮,打开参考类别对话框,见图
宜昌市十一中【参考类别】:可选择【第⼀类别】、【最后类别】或【定制】,本例选择【最后类别】
【类别顺序】:可选择【升序】或【降序】
(5)单击【模型】按钮,打开模型对话框,见下图:
本例主要考察⾃变量age、married、inactive的主效应,暂不考察它们之间的交互作⽤,然后点击【继续】;
(6)单击【statistics】按钮,打开统计对话框,见图:
设置模型的统计量。主要【伪R⽅】【模型拟合信息】【分类表】【拟合优度】这⼏项必选,其他可以默认不勾选。这些参数主要⽤于说明建模的质量。
(7)单击【条件】按钮,打开收敛性准则对话框,见下图,默认选项,
(8) 单击【选项】按钮,打开选项对话框,默认选项,见下图,
(9)单击【保存】按钮,打开保存对话框,勾选【估算响应概率】,估算每个个案三类⼝味偏好的概率。
(10)单击【确定】按钮,得到以下主要结果。
04.结果解释
结果 1 【个案处理摘要表】
列出因变量和⾃变量的分类⽔平及对应的个案百分⽐。建议在此表主要读取变量分类⽔平的顺序,⽐如⾃变量“年龄段”,第⼀个分类是“0~20 岁”,第⼆个分类是“21~25”,第三个分类
是“26~30”,尤其是看清楚最后⼀个分类,因为前⾯参数设置时要求是以最后⼀个分类最为对⽐参照组的。
结果 2 【模型拟合信息表】
读取最后⼀列,显著性值⼩于 0.05,说明模型有统计意义,模型通过检验。
结果 3 【拟合优度表】山东大学威海分校图书馆
原假设模型不能很好地拟合原始数据,最后⼀列⽪尔逊卡⽅显著性值 0.343,概率较⼩,原假设不成⽴,说明模型对原始数据的拟合没有通过检验。拉伸模量
结果 4【伪 R ⽅表】
藻花香猪
依次列出的 3 个伪 R ⽅值(类似于决定系数)均偏低,最⾼ 0.836,说明模型对原始变量变异的解释程度较好,只有⼀⼩部分信息⽆法解释,拟合程度⽐较优秀。
结果 5【模型似然⽐检验表】
最终进⼊模型的效应包括截距、年龄、婚姻状况、⽣活态度,⽽且最后⼀列显著性值表明,只有⽣活态度对模型构成有显著贡献。
结果 6【参数估计表】
列出⾃变量不同分类⽔平对⼝味偏好的影响检验,是多项 logistic 回归⾮常重要的结果。第⼆列B 值,即各⾃变量不同分类⽔平在模型中的系数,正负符号表明它们与早餐选择是正⽐还是反⽐关系。第六列是⽡尔德检验显著性值,此值⼩于 0.05 说明对应⾃变量的系数具有统计意义,对因变量不同分类⽔平的变化有显著影响。⽐如,酸和辣相⽐,21~25岁的年轻⼈更偏向于选择在酸,这种可能性是 26~30 岁以上⼈的 3.8 倍;甜和辣相⽐,结婚与否对⼝味偏好没有差别。
05.多项 logistic 回归模型
经过对该⼝味偏好调查数据进⾏多项 logistic 回归分析,由参数估计表,我们可以得到模型如下:
G1=LOG[P(酸)/P(辣)]=17.915-56.406age1 1.348age2 19.333married0-19.801inactive0
G2=LOG[P(甜)/P(辣)]=18.609-19.954age1-0.039age2-0.446married0-.022inactive0
G3=0 (对照组)
金融英语考试根据这个模型,我们⾸先计算某个受访者 G1、G2、G3 的值,然后带⼊如下公式,最终可得到三个早餐相应的概率。
P1=exp(G1)/[exp(G1) exp(G2) exp(G3)]
P2=exp(G2)/[exp(G1) exp(G2) exp(G3)]
P3=exp(G3)/[exp(G1) exp(G2) exp(G3)]
原始数据最右侧新增3个变量,依次为EST1_1、EST2_1、EST3_1,分别对应因变量“⼝味偏好”的三个分类⽔平(酸、甜、辣)的响应概率。⽐如第⼀个个案,他选择酸的概率为0.67,在三种选择中数值最⼤,因此,模型会判定他选择酸,这和原始记录的真值⼀致,说明模型判断准确。
结果 7【分类】
模型在预测辣味偏好倾向上准确率最⾼,达到100%,其他两个⼝味偏好的预测略低,模型总体预测准确率为83.9%,表现⽐较好。前⾯伪 R ⽅数据显⽰,模型对总体变异的解释能⼒尚可,这和总体预测准确率结论也⼀致。
以上就是本节的全部内容,请⼤家多多练习~

本文发布于:2024-09-22 19:41:33,感谢您对本站的认可!

本文链接:https://www.17tex.com/xueshu/434897.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:模型   变量   分类   选择   打开
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议