现要你给出疾病诊断的一种方法。
胃癌患者容易被误诊为萎缩性胃炎患者或非胃病者。从胃癌患者中抽取5人(编号为1-5),从萎缩性胃炎患者中抽取5人(编号为6-10),以及非胃病者
中抽取5人(编号为11-15),每人化验4项生化指标:血清铜蓝蛋白()、 蓝反应()、尿吲哚乙酸()、中性硫化物()、测得数据如表1所示:
表1. 从人体中化验出的生化指标
No. | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 |
| 228 | 245 | 200 | 170 | 100 | 255 | 130 | 150 | 120 | 160 |
| 134 | 134 | 167 | 150 | 167 | 125 | 100 | 117 | 133 | 100 |
| 0.2 | 0.1 | 0.12 | 0.07 | 0.20 | 0.07 | 0.06 | 0.07 | 0.1 | 0.05 |
| 0.11 | 0.4 | 0.27 | 0.08 | 0.14 | 0.14 | 0.12 | 0.06 | 0.26 | 0.10 |
11 | 五里墩立交桥12 | 13 | 14 | 15 |
185 | 170 | 165 | 135 | 100 |
115 | 125 | 142 | 108 | 117 |
0.05 | 0.06 | 0.05 | 厦门pm2.50.02 | 0.07 |
0.19 | 0.04 | 0.08 | 0.12 | 0.02 |
| | | | | | | | | | | | |
根据数据,试给出鉴别胃病的方法。
论文题目:胃病的诊断
摘 要
在临床医学中,诊断试验是一种诊断疾病的重要方法。好的诊断试验方法将对临床诊断的正确性和疾病的效果起重要影响。因此,对于不同疾病不断发现新的诊断试验方法是医学进步的重要标志。传统的诊断试验方法有生化检测、DNA检测和影像检测等方法。而本文则通过利用多元统计分析中的判别分析及SPSS软件的辅助较好地解决了临床医学中胃病鉴别的问题。在临床医学上,既提高了临床诊断的正确性,又对疾病的效果起了重要效果,同时也减轻了病人的负担。 判别分析是在分类确定的条件下,根据某一研究对象的各种特征值判别其类型归属问题的一种多变量统计分析方法。 其基本原理是按照一定的判别准则,建立一个或多个判别函数,用研究对象的大量资料确定判别函数中的待定系数,并计算判别指标。猴子的B和人的B一样吗
首先,由判别分析定义可知,只有当多个总体的特征具有显著的差异时,进行判别分析才有意义,且总体间差异越大,才会使误判率越小。因此在进行判别分析时,有必要对总体多元变量的均值进行是否不等的显著性检验。
其次,利用判别分析中的费歇判别和贝叶斯判别进行判别函数的建立。
最后,利用所建立的判别函数进行回判并测得其误判率,以及对其修正。
本文利用SPSS软件实现了对总体间给类变量的均值是否不等的显著性检验并根据样本建立了相应的费歇判别函数和贝叶斯判别函数,最后进行了回判并测得了误判率,从而获得了在临床诊断中模型,给临床上的诊断试验提供了新方法和新建议。
关键词:判别分析;判别函数;Fisher判别;Bayes判别
一 问题的提出
在传统的胃病诊断中,胃癌患者容易被误诊为萎缩性胃炎患者或非胃病患者,为了提高医学上诊断的准确性,也为了减少因误诊而造成的病人死亡率,必须要出一种最准确最
有效的诊断方法。为诊断疾病,必须从人体中提取4项生化指标进行化验,即血清铜蓝蛋白、蓝反应、尿吲哚乙酸、中性硫化物。但是,从人体中化验出的生化指标,必须要确定一个精准的指标来判断疾病所属的类型。设想,使用判别分析法,利用SPSS软件对各个变量进行系统的分析,使该问题得到有效地解决。
二、问题的分析
雷达检测由题意可知,目的就是为了建立一种模型,解决医学上的这种误诊问题。在该问题中,必须确定血清铜蓝蛋白、蓝反应、尿吲哚乙酸、中性硫化物与胃癌、萎缩性胃炎的关系。衡量该四项指标的数学要点必然是相应的标准差、方差、均值等,同时,会建立一个或几个函数分析其间关系的正相关或负相关,即其具有一定的相关性,然后利用所给数据求解出一定的数学模型表达式,便可求解出胃病的鉴别方法。
三、符号的说明
X1:血清铜蛋白
X2:蓝反应
X3:尿吲哚乙酸
X4:中型硫化物
N: 被调查的样本数
Wilks的lambda:组内平方和与总平方和之比(当所有观测的组均值相等时,Wilks的lambda值为1;当组内变异与总变异相比小时,Wilks的lambda值接近于0。因此,Wilks的lambda值大,表示各个组的均值基本相等;Wilks的lambda小表示组间有差异。在判别分析中,只有组均值不等时,判别分析才有意义)
F:F值,F分布中的统计检定值
df:自由度
sig.:统计显著性,即出现目前样本的机率
P:p值
四、问题的假设
1.该四项生化指标是分别可以测得的。
2.每个生化指标都不是其他三个指标的线性组合,即两两之间无相关性。
3.被抽取的三类人员中彼此没有任何血缘关系。
4.除了本题研究的疾病外,被调查的人员无任何疾病。
五、模型的建立
根据以上的分析,回忆所学的知识,发现该问题符合判别分析法的要求,因此可以用判别分析法来求解,其中,判别分析法可以分为:距离判别法、Fisher判别法、Bayes判别法等。SPSS软件是统计分析软件之一,它可以进行各种统计分析工作。另外,它所具有的强大的图形输出功能,使运行该软件不仅可以得到各种数字分析结果,还可以得到各种直观、清晰、漂亮的统计图形。从而利用软件SPSS,将所有的数据输入进去,便可以得到协方差矩阵、自由度、p值、均值、标准差等与该问题相关的有利于分析问题的数据及图形。
现在主要利用Fisher判别法、Bayes判别法来处理该问题。
Fisher判别法的基本思想: 从个总体中抽取具有个指标的样品观测数据,借助方差分析的构造一个线性判别函数: ,其中系数确定的原则是使得总体之间区别最大,而使每个总体内部的离差最小。有了线性判别函数U后,对于一个新的样品,将它的个指标值代入以上线性判别函数式中求出值,然后根据判别一定的规则,就可以判别新的样品属于哪个总体。
Bayes判别法的基本思想:设有个总体,其各自的分布密度函数互不相同的,假设个总体各自出现的概率分别为(先验概率),,。假设已知若将本来属于总体的样品错判到总体时造成的损失为,。在这样的情形下,对于新的样品判断其来自哪个总体。
拉姆齐定价 通过这两种方式利用软件SPSS来求解,得出的数据在分析比较后,就可以得出结果。
六、模型的求解
1.spss操作步骤如下
(1)建立数据文件
在数据窗口中输入上入待分析的数据。
(2)按顺序单击分析→分类→判别菜单项,如图-1所示,系统弹出判别分析的对话框,如图-2所示
图-1 先选择菜单进入判别分析对话框
注:X1:血清铜蛋白
X2:蓝反应
X3:尿吲哚乙酸
X4:中型硫化物
(3)选择参与判别分析的变量及其他相关设置
1)分组变量框:从左侧选入分类变量“类型”于分组变量框中。
2)定义范围按钮:定义分类变量的取值范围。单击分类变量按钮,系统弹出一个对话框,如图-3所示。最小值输入1,最大只输入3.完成设置后,单击继续按钮,返回判别分析主对话框,见图-2.
图-2 判别分析的主对话框
图-3 指定分类变量范围对话框
3)自变量列表框:从左侧的变量列表将参与判别分析的变量“X1—X4”于其中,如图-4所示。
4)一起输入变量单按钮:表示选择所有变量参与判别分析,如图-4所示。
图-4
(4)判别分析的统计输出设置。单击统计量按钮,系统弹出一个对话框,如图-5所示。
图-5 判别分析的统计输出设置
1)描述性框:描述统计量选项组,包括3个复选框项,复选均值复选框和单变量复选框。如图-5口袋罪所示
均值复选框:各类中个变量的均值、标准差和各自变量总样本的均值、标准差;
单变量复选框:变量均值的单因子差异假设实验。
2) 函数系数框:判别函数系数选项组,复选Fisher复选框和未标准化复选框,如图-5所示。
Fisher复选框:给出贝叶斯判别函数的系数。
未标准化复选框:给出未标准化的Fisher判别函数的系数。
(5)指定判别分析的有关参数及有关输出结果设置。单击分类按钮,系统弹出一个对话框,如图-6所示。
图-6 指定参数与结果对话框
1)先验概率框:先验概率选项组,包括两个单选项,单选所有组相等框如图-6所示。
所有组相等框:个二类先验概率相等。
2)输出框:分类结果选项组,包括三个复选项,复选个案结果、摘要表和不考虑该个案时的分类复选框如图-6所示。
个案结果复选项:对每个样品输出判别函数值、实际类、预测类和后验概率。
摘要表复选项:输出分类小结,给出正确分类的样品数、错分样品数和错分率。