随机序列的统计检验之卡方检验

     
随机数序列的统计检验之χ2检验
论文摘要:
本文主要介绍了随机数序列的一种统计检验方法-—卡方检验(检验).文章对随机数的定义以及随机数序列的分类进行了说明介绍,并介绍了两种应用最为广泛的拟合优度检验法。进一步地介绍了检验在农业及医学方面的应用,并客观评价了检验方法的优劣性。
引言 关于随机数的研究,从很早以前就有.以前对于随机数的产生基本都是一些比较古老的方法,例如古人喝酒时玩的掷骰子的游戏,其实就是一个产生随机数的过程。直到现在,仍然有很多统计学者,在前人的基础上发展创新,致力于随机数的产生及检验的研究。在当下,随机数的应用范围更为广泛,不仅是类似于古人掷骰子的购买的研究,更是广泛地应用到医学、农业等各个领域。并且随着计算机的应用与发展,计算机模拟的技术也逐步被深入研究和广泛应用。利用计算机来产生随机数已经成为一个新的课题。相比于之前,计算机产生的随机数在均匀性和随机性方面都更好,且模拟处理的问题更为广泛.随着随机数应用范围的扩大,对于随机数的均匀性、独立性、随机性等的检验也不可或缺,只有通过了检验的随机数才能有更广大的利用空间。本文介绍的就是随机数序列统计检验的其中一种方法——检验。
(一) 随机序列的定义及分类
在介绍随机数序列的检验之前,在这里先介绍一下随机数序列的定义和分类[2].
ungelivable
在连续型随机变量的分布中,最简单而且最基本的分布是单位均匀分布。由该分布抽取的简单子样称随机数序列,其中每一个体称为随机数。其分布密度函数为:
           
分布函数为 :
随机数列可以分为三种不同的类型:真随机数列,准随机数列,伪随机数列。
真随机数数列是不可预计的,所以不可能重复产生两个相同的真随机数数列.真随机数只能用某些随机物理过程来产生,如放射性衰变等。
准随机数序列并不具有随机性质,仅仅是它用来处理问题时能够得到正确结果。准随机数的概念是来自如下的事实:对伪随机数来说,要实现其严格数学意义上的随机性,在理论上是不可能的,在实际应用中也没有这个必要。关键是要保证随机数数列具有能产生出所需要的结果的必要特性。
伪随机数序列是我们通常在实际应用的,是通过某些数学公式计算而产生的。这样的伪随机数从数学意义上讲已经一点不是随机的了。但是,只要伪随机数能够通过随机数的一系列的统计检验,我们就可以把它当作真随机数而放心地使用。这样我们就可以很经济地、重复地产生出随机数。
(二)χ2拟合优度检验法
χ2检验的方法中,最简单也用得最为广泛的是χ2拟合优度检验法[1]。该方法可分为两种类型进行讨论:
.多项分布的χ2检验
设总体X是仅取个可能值的离散型随机变量,设X的可能值为1,2,,k,且.又设是从总体X抽得的简单随机样本;NI表示样本观察值中取值为的个数,即样本中出现事件的频数。
定理1  成立时,按规定的检验统计量.
则由定理1知,对给定的检验水平,可以取临界值,当时拒绝H0.
。分布中含有未知参数的χ2检验
在实际问题中,更常见的一类问题是要检验总体分布是否具有确定的类型,即检验假设
其中函数的形式已知,参数空间也已知。
把实轴划分成个互不相交的区间是视具体情况选取的个实数,且记
表示样本中落在内的个数。
定理2  若假设成立,则按式给出的检验统计量
则按定理2知对给定的检验水平,取临界值,当时拒绝假设,反之接受假设nap积分
这里需要注意的是χ2拟合优度检验法是在充分大时推导出来的,所以在使用是必须注意要足够的大,以及不太小这两个条件.我们一般的要求是不小于50,并且每个都不小于5(最好是大于10)。
对于随机数的χ2检验,只用把带入公式即可。
(三)卡方检验的应用及评价
关于随机数序列代表的实际意义,使用卡方检验的方法,在实际生活中有相当广泛的应用,这里介绍的,是使用EXCEL软件建立卡方检验的一些应用,包括在农业统计[3]和临床数据分析[4]等方面。而Microsoft Excelavalon总线软件具有易学、易用、易懂的特性,并且还提供了很多基本和经典的统计分析方法。可通过添加“分析工具库”后利用“工具”菜单的“数据分析"功能来实现,但没有提供现成的卡方检验。在农业统计的遗传学分析中,常用来检验所得实际结果是否与孟德尔遗传的分离比例相符,如检测其与某种理论比例的适合性,其值可以直接用如下简式求出,见表1。
1   检验两组资料与某种理论比例符合度的值公式
 
理论比例(显性:隐形)            公式
    1:1                           
    2:1                           
    3:1                           
    15:1                         
    9:7                           
    13:3                         
    r:1                         
在农业统计中,检验还可用于独立性检验.例如研究小麦种子灭菌和麦穗发病两个变数之间是否独立。若相互独立,表示种子灭菌和发病高低无关,灭菌处理对发病无影响;若不相互独立,则表示种子灭菌和发病高低有关,灭菌处理对发病有影响。这主要是采用表进行独立性检验计算.常用的有2x2表、2x3表和3x3表等,在这里就不做介绍了。
检验在临床数据分析方面,只需在四格表内填入数字即可,操作方便快捷,可直接给出检验的统计量和P值。
虽然随机序列的卡方检验具有很广泛的应用,但是其依然具有片面性[5]。那是因为现有
随机性检测规范没有系统地讨论统计检验和随机本质的联系, 也没有严格论证样本量和结论可信度的联系,使其可操作性不强,难以指导实际的安全性评估工作,甚至有可能误导实际的测试工作。所以我们还有待对卡方检验进行改进[6]
唐成良在随机数的卡方检验的广泛应用上,可以看出来数理统计知识内容在生活和生产中都有着极其广泛而重要的应用.而关于卡方检验,其实关于它的所有知识内容都是起步于对卡方分布的定义。所以说,数学知识的内容都可以由浅入深逐步扩展,有待我们所有的学者去探索和发展,不要止步于前人的经验和理论,探索无极限。
参 考 文 献
[1]朱燕堂,赵选民,徐伟概率论与数理统计西安:西北工业大学出版社,1997。8:140—142
[2]张咏随机数发生器和随机数检验性能研究太子乐金100.电子科技大学美国俄亥俄州2006。1:11—15
[3]谭永强,余华强,陈桥生,刘莹利用EXCEL软件建立卡方检验分析模版在农业统计中的作用湖北农业科学,49卷12期 ,2010.12:
[4]冯松,郑斌利用EXCEL进行卡方检验为临床数据分析提供支持, 2011。9
[5]石竑松,张翀斌,杨永生,高金萍随机性检测及其片面性清华大学学报(自然科学版),51卷10期,2011
[6]DAI Jia Jia,YANG Ai JunAModified Chi—Squared Goodness—of—Fit TestCollege of Appilied Sciences,Vol.29,No.1,2009.1

本文发布于:2024-09-23 23:21:07,感谢您对本站的认可!

本文链接:https://www.17tex.com/xueshu/295768.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:检验   统计   产生   分布   应用   序列   具有   农业
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议