非参数检验之符号检验、Wilcoxon符号秩检验、游程检验

这篇具有很好参考价值的文章主要介绍了非参数检验之符号检验、Wilcoxon符号秩检验、游程检验。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

目录

一、符号检验

例2.1下面是世界上71个大城市的花费指数(包括租金)按递增次序排列如下(这里上海是44位,其指数为63.5):

R代码:

二、Wilcoxon符号秩检验

例2.3下面是10个欧洲城镇每人每年平均消费的酒类相当于纯酒精数(单位:升).数据已经按照升幂排列.

R代码:

三、游程检验

R代码:


一、符号检验

广义符号检验是对连续变量π分位点 xn 进行的检验,而狭义的符号检验则是针对中位数M= Q0.5

进行的检验。

例2.1下面是世界上71个大城市的花费指数(包括租金)按递增次序排列如下(这里上海是44位,其指数为63.5):

27.8 27.8 29.1 32.2 32.7 32.7 36.4 36.5 37.5 37.7 38.8 41.9 45.2 45.8 46 47.6 48.2 49.9 51.8 52.7 54.9 55 55.3 55.5 58.2 60.8 62.7 63.5 64.6 65.3 65.3 65.3 65.4 66.2 66.7 67.7 71.2 71.7 73.9 74.3 74.5 76.2 76.6 76.8 77.7 77.9 79.1 80.9 81 82.6 85.7 86.2 86.4 89.4 89.5 90.3 90.8 91.8 92.8 95.2 97.5 98.2 99.1 99.3 100 100.6 104.1 104.6 105 109.4 122.4

请检验以下问题:

(1)有人说64是中位数(样本中位数为67.7,大于64)

(2)有人说64是下四分位数(样本下四分位数为50.85,小于64)

回答如下

若想知道样本下四分位点 是否小于64的检验.形式上,我们的检验是:

(1)这里的64就是.按照零假设,小于64的样本点个数的实现值应该大约占样本的1/4,或者服从Bin(n,0.25)分布.如果偏离得太远,就有问题了.容易算出=28,非参数检验之符号检验、Wilcoxon符号秩检验、游程检验=43和n=非参数检验之符号检验、Wilcoxon符号秩检验、游程检验=71.根据上面的说明,对于这个例子,p值=1-(K≤-1)=1-(K≤28-1)=1- (K≤27)≈0.00515.因此,可以对于显著性水平α=0.01,拒绝零假设,即下四分位点应该小于64.再看关于64是否为中位数的检验,

 

 

 

(2)同样,非参数检验之符号检验、Wilcoxon符号秩检验、游程检验非参数检验之符号检验、Wilcoxon符号秩检验、游程检验.但是这里涉及的零假设下的分布为Bin(71,0.5),而不是刚才的Bin(71,0.25).取k=min(非参数检验之符号检验、Wilcoxon符号秩检验、游程检验)=28,p值=非参数检验之符号检验、Wilcoxon符号秩检验、游程检验。(K≤k)=非参数检验之符号检验、Wilcoxon符号秩检验、游程检验(K≤28) ≈0.04796.

R代码:

sign.test=function(x,p,M0)   #x为数据,p为分位数,M0为待检验的的数
{s1=sum(x<M0);s2=sum(x>M0);n=s1+s2
p1=pbinom(s1,n,p);p2=1-pbinom(s1-1,n,p)
if (p1>p2) m1="H0: M>=M0"
else m1="H0: M<=M0"
p.value=min(p1,p2);p.value2=2*p.value
list(c("s+"=s2,"s-"=s1,"n'"=n),c("原假设"=m1,"单边p值"=p.value,"双边p值"=p.value2))
}
setwd("C:/Users/Lenovo/Desktop/data")
x1<-read.table("ExpensiveCities.TXT",sep=" ")
sign.test(x1,0.5,64)
sign.test(x1,0.25,64)

代码运行结果:

非参数检验之符号检验、Wilcoxon符号秩检验、游程检验

二、Wilcoxon符号秩检验

在Wilcoxon符号秩检验中,它把观测值和零假设的中心位置之差的绝对值的秩分别按照不同的符号相加作为其检验统计量。它适用于T检验中的成对比较,但并不要求成对数据之差di服从正态分布,只要求对称分布即可。检验成对观测数据之差是否来自均值为0的总体(产生数据的总体是否具有相同的均值)。

例2.3下面是10个欧洲城镇每人每年平均消费的酒类相当于纯酒精数(单位:升).数据已经按照升幂排列.

4.12 5.81 7.63 9.74 10.39 11.92 12.32 12:89 13.54 14.45

人们普遍认为欧洲各国人均年消费酒量的中位数相当于纯酒精8升,我们希望用上述数据来检验这种看法.

解题过程:

设即零假设为:对上述数据的计算得到中位数为因此,我们的备选假设为:符号秩检验步骤如下:设=8,即零假设为H0:M=8.对上述数据的计算得到中位数为11.160.因此,我们的备选假设为H1:M>8.Wilcoxon符号秩检验步骤如下:

(1)对计算,它们代表这些样本点到的距离,对于例数据,则计算,得到、、、、、、、、、(1)对i=1,…,n,计算|−l,它们代表这些样本点到M0的距离,对于例2.3数据,则计算|−8|,i=1,…,10,得到:

3.88、2.19、0.37、1.74、2.39、3.92、4.32、4.89、5.54、6.45.

(3)把上面的n个绝对值排序,并找出它们的n个秩.如果有相同的样本点,每个点取平均秩.对于例2.3数据,这些秩为5、3、1、2、4、6、7、8、9、10

(3)令非参数检验之符号检验、Wilcoxon符号秩检验、游程检验等于的的秩的和.而W−等于的的秩的和.注意:非参数检验之符号检验、Wilcoxon符号秩检验、游程检验.对于例2.3数据,加上符号的秩为−5、−3、−1、2、4、6、7、8、9、10

因此,非参数检验之符号检验、Wilcoxon符号秩检验、游程检验非参数检验之符号检验、Wilcoxon符号秩检验、游程检验

(4)对双边检验,在零假设下,W+和W−应差不多,因而,当其中之一很小时,应怀疑零假设,在此,取检验统计量非参数检验之符号检验、Wilcoxon符号秩检验、游程检验.类似地,对于单边检验,取,对单边检验:,取非参数检验之符号检验、Wilcoxon符号秩检验、游程检验.对于例2.3的问题,取.

(5)根据得到的W值,利用统计软件或查Wilcoxon符号秩检验的分布表以得到在零假设下的p值.得到p值为0.032.

(6)如果p值较小(比如小于或等于给定的显著性水平,譬如0.05)则可以拒绝零假设.如果p值较大则没有充分证据来拒绝零假设,但不意味着接受零假设.对于例2.3的问题,如果给定α=0.05,由于p值(=0.032)小于α,我们可以拒绝零假设,认为欧洲人均酒精年消费多于8升.

R代码:

y<-c(4.12,5.81,7.63,9.74,10.39,11.92,12.32,12.89,13.54,14.45)
wilcox.test(y-8,alt="greater")
wilcox.test(y-12.5,alt="less")
walsh=NULL;for(i in 1:10)for(j in i:10)
walsh=c(walsh,(y[i]+y[j])/2);walsh=sort(walsh)
qsignrank(0.025,10)

代码运行结果如下:

非参数检验之符号检验、Wilcoxon符号秩检验、游程检验

三、游程检验

游程检验亦称“连贯检验”,是根据样本标志表现排列所形成的游程的多少进行判断的检验方法。 游程检验是一种非参数性统计假设的检验方法,它是游程总数检验和最大游程检验的总称,用于两个独立样本的比较和观测结果随机性的检验测试。

游程检验检验问题可以表达为:

数据出现顺序随机数据出现顺序随机数据出现顺序随机⇔数据出现顺序随机

例2.6如在工厂的全面质量管理中,生产出来的20个工件的尺寸按顺序为(,…,)(单位cm)12.27、9.92、10.81、11.79、11.87、10.90、11.22、10.80、10.33、9.30、9.81、8.85、9.32、8.67、9.32、9.53、9.58、8.94、7.89、10.77人们想要知道生产出来的工件的尺寸变化是否只是由于随机因素,还是有其它非随机因素.

解题过程:

先找出它们的中位数为=9.865,再把大于的记为1,小于的记为0,于是产生一串1和0: 

1 1 1 1 1 1 1 1 1 0 0 0 0 0 0 0 0 0 0 1

也就是说,变成了前面的情况.这时R=3,m=n=10而按照上面的公式(只要算两项),P(R<=3) =P(R=2)+P(R=3)=0.00006即p值为0.0001.于是可以在水平a>0.0001时拒绝零假设.这里,算的是P(R<=3)而不是P(R>=3)是因为显然R=3离最小可能的值2要比最大可能的值20要近,因此可以说,在生产过程中有非随机因素起作用。

根据我们的R程序得到精确的双边检验的p值为0.00012,而相应的渐近的p值为0.00024.精确的p值和渐近p值差别较大,显然,这源于样本量不够大。

R代码:

run.test=function(y,cut=0){ if(cut!=0)x=(y>cut)*1 else x=y
N=length(x);k=1;for(i in 1:(N-1))if (x[i]!=x[i+1])k=k+1;r=k;
m=sum(1-x);n=N-m;
P1=function(m,n,k){
  2*choose(m-1,k-1)/choose(m+n,n)*choose(n-1,k-1)}
P2=function(m,n,k){choose(m-1,k-1)*choose(n-1,k)/choose(m+n,n)
  +choose(m-1,k)*choose(n-1,k-1)/choose(m+n,n)}
r2=floor(r/2);if(r2==r/2){pv=0;for(i in 1:r2) pv=pv+P1(m,n,i);
for(i in 1:(r2-1)) pv=pv+P2(m,n,i)} else {pv=0
for(i in 1:r2) pv=pv+P1(m,n,i)
for(i in 1:r2) pv=pv+P2(m,n,i)};if(r2==r/2)
  pv1=1-pv+P1(m,n,r2) else pv1=1-pv+P2(m,n,r2);
z=(r-2*m*n/N-1)/sqrt(2*m*n*(2*m*n-m-n)/(m+n)^2/(m+n-1));
ap1=pnorm(z);ap2=1-ap1;tpv=min(pv,pv1)*2;
list(m=m,n=n,N=N,R=r,Exact.pvalue1=pv,
     Exact.pvalue2=pv1,Aprox.pvalue1=ap1, Aprox.pvalue2=ap2,
     Exact.2sided.pvalue=tpv,Approx.2sided.pvalue=min(ap1,ap2)*2)}
x=c(12.27,9.92,10.81,11.79,11.87,10.90,11.22,10.80,10.33,9.30,9.81,8.85,9.32,8.67,9.32,9.53,9.58,8.94,7.89,10.77)
x=as.matrix(x)#设置成矩阵数据
y=factor(sign(x-median(x)));run.test(x>median(x))

代码运行结果:

非参数检验之符号检验、Wilcoxon符号秩检验、游程检验文章来源地址https://www.toymoban.com/news/detail-416530.html

到了这里,关于非参数检验之符号检验、Wilcoxon符号秩检验、游程检验的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • SPSS参数检验、非参数检验、方差分析

    在做数据分析的时候,不是只要有数据,就拿去做模型,也有很多数据,结合需求,是不需要用到模型的,比如: 奶茶店,老板想看一下,合作时间(年份为单位)与奶茶店销量的关系与差异。 像这样,只有一个自变量和一个因变量的数据,做模型效果是非常差的,也不能

    2023年04月08日
    浏览(19)
  • 参数检验和非参数检验(结合SPSS分析)

    概念 :是一种根据样本数据来推断总体的分布或均值、方差等总体统计参数的方法。 根据 样本 来推断 总体 的原因: 总体数据不可能全部收集到。如:质量检测问题 收集到总体全部数据要耗费大量的人力和财力 假设检验包括: 参数检验 非参数检验 基本原理 :利用小概率

    2024年02月06日
    浏览(14)
  • 参数与非参数检验:理解差异并正确使用

    数据科学是一个快速发展的领域,它在很大程度上依赖于统计技术来分析和理解复杂的数据集。这个过程的一个关键部分是假设检验,它有助于确定从样本中获得的结果是否可以推广到总体。 在这篇文章中,我们将探讨参数与非参数检验之间的区别,提供示例以更好地理解它

    2023年04月24日
    浏览(20)
  • 非参数检验方法,核密度估计简介

    在20世纪,统计学还处于起步阶段计算机还不是那么流行的时候,假设正态分布是生成数据的标准。这主要是因为在那个所有结果都是手工计算的时代,正态分布可以使计算不那么繁琐。 但在这个大数据时代,随着计算能力的提高,数据的可用性使得统计学家采用了更现代的

    2024年02月07日
    浏览(17)
  • 参数估计和假设检验的区别与联系

    笔记来源: 参数估计与假设检验 参数估计和假设检验有什么区别? 参数估计和假设检验是推断统计的两个组成部分,它们都是根据样本信息对总体的数量特征进行推断 下图来自《统计学图鉴》 参数估计和假设检验都是以抽样分布为理论依据,建立在概率论基础之上的统计

    2024年02月09日
    浏览(14)
  • 2023年数学建模:参数估计与假设检验:自助法(Bootstrap)详解

    目录 1. 引言 2. 自助法简介 3. 自助法在参数估计中的应用 3.1 原理

    2024年02月08日
    浏览(15)
  • 概率论与数理统计:第七章:参数估计 第八章:假设检验

    1.矩估计 p i ( θ ) p_i(θ) p i ​ ( θ ) 、 f ( x i , θ ) f(x_i,θ) f ( x i ​ , θ ) ,用矩估计法来估计未知参数θ { X ˉ = E ( X ) 1 n ∑ i = 1 n X i 2 = E ( X 2 ) left{begin{aligned} bar{X} = E(X) \\\\ dfrac{1}{n}sumlimits_{i=1}^nX_i^2 = E(X^2) end{aligned}right. ⎩ ⎨ ⎧ ​ X ˉ = n 1 ​ i = 1 ∑ n ​ X i 2 ​ = ​ E

    2024年02月11日
    浏览(14)
  • 关于SpringBoot、Nginx 请求参数包含 [] 特殊符号 返回400状态

    问题来源: 使用RESTful风格发送带有特殊符号(如:点、大括号等)的请求,当使用Nginx做地址映射时会返回报\\\"HTTP Status 400-Bad Request\\\"的错误,这个时候我们需要对Nginx的映射方式做一下调整。 Nginx调整完发现跳转后又报了同样的错误,是因为SpringBoot也需要做兼容 如果请求地址是

    2024年02月15日
    浏览(16)
  • 机器人学DH参数及利用matlab符号运算推导

    重新复习了一下机器人学DH参数,并且利用matlab符号运算进行了推导,验证了公式。 图中的 坐标系定义 : 坐标系 i {i} i 的 z z z 轴 z i z_i z i ​ 和关节轴线 i i i 共线,指向任意规定。 坐标系 i {i} i 的 x x x 轴 x i x_i x i ​ 和 a i a_i a i ​ 重合,由关节 i i i 指向关节 i + 1 i+1 i

    2024年02月02日
    浏览(11)
  • Java代码瘦身,巧用 @Valid,@Validated 的分组校验和嵌套检验,实现高阶参数校验操作

            在 JavaEE 项目中, RestFull 层接收参数首先要对一些字段的格式进行校验,以防止所有查询都落到数据库,这也是一种合理的限流手段。以前基本上都是用 if...else...,这样的代码太啰嗦,除了使用策略模式进行优化,今天介绍一下校验注解@Valid,@Validated和@PathVariable,

    2024年02月04日
    浏览(21)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包