非参数统计:两样本和多样本的Brown-Mood中位数检验;Wilcoxon(Mann-Whitney)秩和检验及有关置信区间;Kruskal-Wallis秩和检验

这篇具有很好参考价值的文章主要介绍了非参数统计:两样本和多样本的Brown-Mood中位数检验;Wilcoxon(Mann-Whitney)秩和检验及有关置信区间;Kruskal-Wallis秩和检验。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

目录

两样本和多样本的Brown-Mood中位数检验

例3.1我国两个地区一些(分别为17个和15个)城镇职工的工资(元):

Wilcoxon(Mann-Whitney)秩和检验及有关置信区间

例3.1我国两个地区一些(分别为17个和15个)城镇职工的工资(元):

Kruskal-Wallis秩和检验

例4.1在一项健康实验中,三人组有三种生活方式,他们的减肥效果如下表:


  • 两样本和多样本的Brown-Mood中位数检验

定义:零假设:H0:Mx=My,备择假设:H1:Mx<My.

如果H0成立,两样本混合中位数Mxy可以均匀的分开X和Y两个样本,检验关注A的数值,A的意义是样本X混合中位数右侧的个数,如果A很大,则表示样本X的中位数明显大于样本Y的;如果A很小,则表示样本Y的中位数明显大于样本X的。

例3.1我国两个地区一些(分别为17个和15个)城镇职工的工资(元):

地区1:6864 7304 7477 7779 7895 8348 8461 9553 9919 10073 10270 11581 13472 13600 13962 15019 17244

地区2:10276 10533 10633 10837 11209 11393 11864 12040 12642 12675 13199 13683 14049 14061 16079

人们想要知道这两个地区平均城镇职工工资的中位数是否一样.

答:由题里的数据可制作下图:

非参数统计:两样本和多样本的Brown-Mood中位数检验;Wilcoxon(Mann-Whitney)秩和检验及有关置信区间;Kruskal-Wallis秩和检验

箱线图从左到右依次代表地区1,地区2和混合样本的数据

令地区1的样本数据中位数为Mx,地区2的为My,混合样本数据的中位数为Mxy.

零假设:H0:Mx=My,备择假设:H1:Mx<My.

如果H0成立,则混合样本的中位数Mxy在地区1、地区2的两个样本中,大于或小于Mxy应该大体一样。

由数据算得Mxy=11301,用两样本数据和Mxy比较后得到下表1:

地区1(X)

地区二(Y)

总和

大于Mxy的数目

a=6

b=10

t=16

小于Mxy的数目

m-a=11

n-b=5

N-t=16

总和

m=17

n=15

N=32

令A表示列表中a的取值,在m,n和t固定时,A的分布在H0下的超几何分布(m<k)为:

P(A=k)=mknt-km+nt非参数统计:两样本和多样本的Brown-Mood中位数检验;Wilcoxon(Mann-Whitney)秩和检验及有关置信区间;Kruskal-Wallis秩和检验

Brown-Mood中位数检验的基本内容(表2):

零假设:H0

备择假设:H1

检验统计量

P

H0:Mx=My

H1:Mx<My

A

P(X≥a)

H0:Mx=My

H1:Mx>My

A

P(X≤a)

H0:Mx=My

H1:Mx≠My

A

2min(P(X≥a),P(X≤a))

由表1数据可知,p值为P(X≤a)=P(X≤6)=0.07780674(由r算得),根据这个p值,按照显著性水平0.05,无法拒绝原假设。也就是两个地区平均城镇职工工资的中位数是一样的。

非参数统计:两样本和多样本的Brown-Mood中位数检验;Wilcoxon(Mann-Whitney)秩和检验及有关置信区间;Kruskal-Wallis秩和检验

以此类推,可以求出下表3:

P(X≥6)

0.9221933

P(X≤6)

0.07780674

2min(P(X≥6),P(X≤6))

0.1556135

在零假设下,在大样本时,可以从超几何分布的均值和标准差的表达式来得到正态近似统计量为:

Z=A±0.5-mt/Nmnt(N-t)/N3非参数统计:两样本和多样本的Brown-Mood中位数检验;Wilcoxon(Mann-Whitney)秩和检验及有关置信区间;Kruskal-Wallis秩和检验~N(0,1)

对于双边备则检验(H1:Mx≠My),在大样本情况下,可以用检验统计量

K=2a-m2(m+n)mn非参数统计:两样本和多样本的Brown-Mood中位数检验;Wilcoxon(Mann-Whitney)秩和检验及有关置信区间;Kruskal-Wallis秩和检验

它近似服从自由度为1的卡方分布,当K=3.137255,p值为0.0765225.

由于0.0765225>0.05所以我们有没有充分理由拒绝H0非参数统计:两样本和多样本的Brown-Mood中位数检验;Wilcoxon(Mann-Whitney)秩和检验及有关置信区间;Kruskal-Wallis秩和检验,即不能说A组学生比B组学生算得更快。

R代码:文章来源地址https://www.toymoban.com/news/detail-424638.html

x=c(6864,7304,7477,7779,7895,8348,8461,9553,9919,10073,10270,11581,13472,13600,13962,15019,17244)

y=c(10276,10533,10633,10837,11209,11393,11864,12040,12642,12675,13199,13683,14049,14061,16079)

z=c(6864,7304,7477,7779,7895,8348,8461,9553,9919,10073,10270,11581,13472,13600,13962,15019,17244,10276,10533,10633,10837,11209,11393,11864,12040,12642,12675,13199,13683,14049,14061,16079)

boxplot(x,y,z)

median(z, na.rm = FALSE)

a=6

b=10

m=17

n=15

phyper(a,m,n,a+b)

1-phyper(a,m,n,a+b)

1-phyper(a-1,m,n,(m+n)-(a+b))

2*phyper(a,m,n,a+b)

pnorm((a+0.5-m*(a+b)/(m+n))/sqrt(m*n*(a+b)*(m+n-(a+b))/(m+n)^3))
  • Wilcoxon(Mann-Whitney)秩和检验及有关置信区间

定义:Wilcoxon(Mann-Whitney)秩和检验是Brown-Mood中位数检验的升级版,假设两个总体分布有类似的形状,不假定对称。

X1,X2,…,Xm~F(X-μ1);Y1,Y2,…,Yn~(Y-μ2)

零假设:H0:μ1=μ2,备择假设:H1:μ1≠μ2

例3.1我国两个地区一些(分别为17个和15个)城镇职工的工资(元):

地区1:6864 7304 7477 7779 7895 8348 8461 9553 9919 10073 10270 11581 13472 13600 13962 15019 17244

地区2:10276 10533 10633 10837 11209 11393 11864 12040 12642 12675 13199 13683 14049 14061 16079

人们想要知道这两个地区平均城镇职工工资的中位数是否一样.

答:令地区1的样本数据中位数为Mx,地区2的为My,混合样本数据的中位数为Mxy.

零假设:H0:Mx=My,备择假设:H1:Mx<My.

下面是两个地区混合样本的秩:

X

6864

7304

7477

7779

7895

8348

8461

9553

9919

1

2

3

4

5

6

7

8

9

X

10073

10270

11581

13472

13600

13962

15019

17244

10

11

18

24

25

27

30

32

Y

10276

10533

10633

10837

11209

11393

11864

12040

12642

12

13

14

15

16

17

19

20

21

Y

12675

13199

13683

14049

14061

16079

22

23

26

28

29

31

非参数统计:两样本和多样本的Brown-Mood中位数检验;Wilcoxon(Mann-Whitney)秩和检验及有关置信区间;Kruskal-Wallis秩和检验

可以得出Wy=306,Wx=222,Wxy=186,Wyx=69.

非参数统计:两样本和多样本的Brown-Mood中位数检验;Wilcoxon(Mann-Whitney)秩和检验及有关置信区间;Kruskal-Wallis秩和检验

对于备则检验H1:Mx<My,得到p值为0.0135。因此,对于高于0.015的置信区间水平都可以拒绝零假设。

非参数统计:两样本和多样本的Brown-Mood中位数检验;Wilcoxon(Mann-Whitney)秩和检验及有关置信区间;Kruskal-Wallis秩和检验

对于双边备择假设H1:Mx≠My,得到p值为0.0270,是上面单边检验的两倍;若用连续修正的正态近似,得到p值为0.0285,;若不加连续改正量,得到p值为0.0272.

非参数统计:两样本和多样本的Brown-Mood中位数检验;Wilcoxon(Mann-Whitney)秩和检验及有关置信区间;Kruskal-Wallis秩和检验

对于备择假设H1:Mx<My,若用连续修正的正态近似,得到p值为0.0143,;若不加连续改正量,得到p值为0.0136.

由于以上计算的所有p值,均小于0.05,所以我们有充分的理由拒绝原假设,即地区1的中位数比地区2小。

Mx-My的点估计和区间估计:

非参数统计:两样本和多样本的Brown-Mood中位数检验;Wilcoxon(Mann-Whitney)秩和检验及有关置信区间;Kruskal-Wallis秩和检验

由上述代码运行结果知,Mx-My的点估计为-2479.

非参数统计:两样本和多样本的Brown-Mood中位数检验;Wilcoxon(Mann-Whitney)秩和检验及有关置信区间;Kruskal-Wallis秩和检验

由上述代码运行结果知,Mx-My的(1-α)置信区间为(-3916,-263)。

R代码:

x=c(6864,7304,7477,7779,7895,8348,8461,9553,9919,10073,10270,11581,13472,13600,13962,15019,17244)

y=c(10276,10533,10633,10837,11209,11393,11864,12040,12642,12675,13199,13683,14049,14061,16079)

m=length(x);n=length(y);m;n;

Wxy=sum(outer(y,x,"-")>0);Wxy

Wyx=sum(outer(x,y,"-")>0);Wyx

pwilcox(69,m,n)

wilcox.test(x,y)

wilcox.test(x,y,exact=F)

wilcox.test(x,y,exact=F,cor=F)

wilcox.test(x,y,exact=F,alt="less")

wilcox.test(x,y,exact=F,alt="less",cor=F)

median(outer(x,y,"-"))

D=sort(as.vector(outer(x,y,"-")))

qwilcox(0.025,m,n)

D[76]

D[m*n+1-76]
  • Kruskal-Wallis秩和检验

定义:Kruskal-Wallis秩和检验根据所有数据从小到大排序,算出每个数据的秩。其中Ri为每组的秩和,ni为每组的样本个数。当每组样本中的观察数目有5个或5个以上,则样本统计量 KWC 的分布与自由度为k-1的卡方分布非常接近。因此,KW统计量可利用卡方分布进行检验。

KW=组间平方和/全体样本的秩方差

如果样本中存在结值(数据相同秩值的个数),则校正系数C=1-Σ(τi非参数统计:两样本和多样本的Brown-Mood中位数检验;Wilcoxon(Mann-Whitney)秩和检验及有关置信区间;Kruskal-Wallis秩和检验^3-τi非参数统计:两样本和多样本的Brown-Mood中位数检验;Wilcoxon(Mann-Whitney)秩和检验及有关置信区间;Kruskal-Wallis秩和检验)/n^3-n,其中τi非参数统计:两样本和多样本的Brown-Mood中位数检验;Wilcoxon(Mann-Whitney)秩和检验及有关置信区间;Kruskal-Wallis秩和检验等于第j个结值的个数,调整后的KWc=KW/C.

Kruskal-Wallis统计量:

H=12N(N-1)i=1kni(Ri-R)2非参数统计:两样本和多样本的Brown-Mood中位数检验;Wilcoxon(Mann-Whitney)秩和检验及有关置信区间;Kruskal-Wallis秩和检验=12N(N-1)i=1kRi2ni-3(N+1)非参数统计:两样本和多样本的Brown-Mood中位数检验;Wilcoxon(Mann-Whitney)秩和检验及有关置信区间;Kruskal-Wallis秩和检验

例4.1在一项健康实验中,三人组有三种生活方式,他们的减肥效果如下表:

生活方式

1

2

3

一个月后减少的重量(单位500g)

3.7

7.3

9.0

3.7

5.2

4.9

3.0

5.3

7.1

3.9

5.7

8.3

2.7

6.5

ni=

5

5

4

人们想知道从这个数据能否得出他们的减肥效果(位置参数)是一样的。

答:假定k个样本有相似的连续正态分布,而且所有的观测值在样本内和样本之间是独立的,我们假定k个独立样本有连续的分布函数F1非参数统计:两样本和多样本的Brown-Mood中位数检验;Wilcoxon(Mann-Whitney)秩和检验及有关置信区间;Kruskal-Wallis秩和检验,…, Fk非参数统计:两样本和多样本的Brown-Mood中位数检验;Wilcoxon(Mann-Whitney)秩和检验及有关置信区间;Kruskal-Wallis秩和检验.我们设

零假设H0:F1非参数统计:两样本和多样本的Brown-Mood中位数检验;Wilcoxon(Mann-Whitney)秩和检验及有关置信区间;Kruskal-Wallis秩和检验(X)=…=Fk非参数统计:两样本和多样本的Brown-Mood中位数检验;Wilcoxon(Mann-Whitney)秩和检验及有关置信区间;Kruskal-Wallis秩和检验(X)=F(X);备择假设H1:Fi非参数统计:两样本和多样本的Brown-Mood中位数检验;Wilcoxon(Mann-Whitney)秩和检验及有关置信区间;Kruskal-Wallis秩和检验(X)=F(X-θi非参数统计:两样本和多样本的Brown-Mood中位数检验;Wilcoxon(Mann-Whitney)秩和检验及有关置信区间;Kruskal-Wallis秩和检验),i=1,…,k

这里F是某连续分布函数,而且这些位置参数θi非参数统计:两样本和多样本的Brown-Mood中位数检验;Wilcoxon(Mann-Whitney)秩和检验及有关置信区间;Kruskal-Wallis秩和检验并不全部相同。

假定有k个样本,各样本的样本量为ni,i=1,…,k.那么,观测值可以写成下面的线性模型:xij非参数统计:两样本和多样本的Brown-Mood中位数检验;Wilcoxon(Mann-Whitney)秩和检验及有关置信区间;Kruskal-Wallis秩和检验=μ+θi非参数统计:两样本和多样本的Brown-Mood中位数检验;Wilcoxon(Mann-Whitney)秩和检验及有关置信区间;Kruskal-Wallis秩和检验+εij非参数统计:两样本和多样本的Brown-Mood中位数检验;Wilcoxon(Mann-Whitney)秩和检验及有关置信区间;Kruskal-Wallis秩和检验,j=1,…, ni非参数统计:两样本和多样本的Brown-Mood中位数检验;Wilcoxon(Mann-Whitney)秩和检验及有关置信区间;Kruskal-Wallis秩和检验及 i=1,…,k,误差是独立同分布的.

我们要检验的是H0非参数统计:两样本和多样本的Brown-Mood中位数检验;Wilcoxon(Mann-Whitney)秩和检验及有关置信区间;Kruskal-Wallis秩和检验: θ1非参数统计:两样本和多样本的Brown-Mood中位数检验;Wilcoxon(Mann-Whitney)秩和检验及有关置信区间;Kruskal-Wallis秩和检验=θ2非参数统计:两样本和多样本的Brown-Mood中位数检验;Wilcoxon(Mann-Whitney)秩和检验及有关置信区间;Kruskal-Wallis秩和检验=…=θk非参数统计:两样本和多样本的Brown-Mood中位数检验;Wilcoxon(Mann-Whitney)秩和检验及有关置信区间;Kruskal-Wallis秩和检验等价于Ha非参数统计:两样本和多样本的Brown-Mood中位数检验;Wilcoxon(Mann-Whitney)秩和检验及有关置信区间;Kruskal-Wallis秩和检验:H0非参数统计:两样本和多样本的Brown-Mood中位数检验;Wilcoxon(Mann-Whitney)秩和检验及有关置信区间;Kruskal-Wallis秩和检验的诸等式中至少有一个不成立。

由题中数据所画箱线图如下:

非参数统计:两样本和多样本的Brown-Mood中位数检验;Wilcoxon(Mann-Whitney)秩和检验及有关置信区间;Kruskal-Wallis秩和检验

非参数统计:两样本和多样本的Brown-Mood中位数检验;Wilcoxon(Mann-Whitney)秩和检验及有关置信区间;Kruskal-Wallis秩和检验

由上述代码运行结果知p=0.00895<0.05,故我们有充分理由拒绝H0非参数统计:两样本和多样本的Brown-Mood中位数检验;Wilcoxon(Mann-Whitney)秩和检验及有关置信区间;Kruskal-Wallis秩和检验,即他们的减肥效果,即位置参数是不一样的。

R代码:

a=c(3.7,3.7,3.0,3.9,2.7)

b=c(7.3,5.2,5.3,5.7,6.5)

c=c(9.0,4.9,7.1,8.3)

boxplot(a,b,c)

m1=length(a)

m2=length(b)

m3=length(c)

m<-m1+m2+m3

library(fBasics)

d=c(a,b,c)

e=c(1,1,1,1,1,2,2,2,2,2,3,3,3,3)

kruskal.test(d,e)

到了这里,关于非参数统计:两样本和多样本的Brown-Mood中位数检验;Wilcoxon(Mann-Whitney)秩和检验及有关置信区间;Kruskal-Wallis秩和检验的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 概率统计·参数估计【区间估计】

    构造一个函数( 主要是函数不用依赖未知量 只有一个未知量,问μ的置信水平用这个函数,如果σ也未知,就要替换掉这个式子中的σ为S,并且变成服从 t 分布 ) 取上下区间(用2个常数确定,如这题中的z ɑ/2 ) 然后,将函数化成只有未知量,此时,两侧为置信上下区间 注

    2024年02月04日
    浏览(15)
  • 23REPEAT方法:软工顶会ICSE ‘23 大模型在代码智能领域持续学习 代表性样本重放(选择信息丰富且多样化的示例) + 基于可塑权重巩固EWC的自适应参数正则化 【网安AIGC专题11.22】

    本文为邹德清教授的《网络安全专题》课堂笔记系列的文章,本次专题主题为大模型。 黄邕灵同学@potatotomato:分享了Keeping Pace with Ever-Increasing Data:Towards Continual Learning of Code Intelligence Models《跟上不断增长的数据:迈向代码智能模型的持续学习》 软工顶会ICSE ‘23: Proceedings of t

    2024年02月05日
    浏览(12)
  • 随机过程 Brown 运动(下)

    以 T x T_x T x ​ 记 Brown 运动首次击中 x x x 的时刻,即: T x = inf ⁡ { t 0 ,   B ( t ) = x } T_x=inf{t0,,B(t)=x} T x ​ = in f { t 0 , B ( t ) = x } 当 x 0 xgt 0 x 0 时,为计算 P ( T x ≤ t ) P(T_xleq t) P ( T x ​ ≤ t ) ,我们考虑 P ( B ( t ) ) ≥ x P(B(t))geq x P ( B ( t )) ≥ x ,由全概率公式: P ( B (

    2023年04月26日
    浏览(13)
  • 关于Android studio新版本和NEW UI显示返回按钮的设置

    1.新版Android studio问题 因为在新版本的Android Studio中,默认情况下是没有直接的选项来显示返回上一步按钮在状态栏上的,可以通过以下方法来实现返回上一步的功能: 在Android Studio的顶部菜单栏中,选择\\\"View\\\"。 在\\\"View\\\"菜单中,选择\\\"Appearance\\\"。 在\\\"Appearance\\\"子菜单中,勾选\\\"To

    2024年02月03日
    浏览(17)
  • transformers里的BertModel之架构和参数统计

     BertModel的架构: 以bert-base-chinese为例: 统计模型参数: 从上面可以看出: embedding层占比 0.16254008305735163 Encoder编码器部分占比 0.8316849528014959 pooler层占比 0.005774964141152439 总共的参数:102267648 返回值分析: 关于BertModel的文档如下: BERT We’re on a journey to advance and democratize a

    2024年02月14日
    浏览(9)
  • python函数装饰器参数统计调用时间和次数

    python在函数装饰器外层定义一个函数生成封闭作用域来保存装饰器入参,供装饰器使用。 描述 通过类的可调用实例装饰器来统计函数每次调用时间和总调用时间,以及调用次数。 (1) time.perf_counter()获取当前时间,单位秒; (2) 调用函数func前和后的时间差,为func的执行

    2024年02月01日
    浏览(17)
  • 数理统计SPSS软件实验报告二--参数估计

    实验报告内容: 1 、实验目的: 熟练掌握利用SPSS进行参数估计的实现方法。 2 、实验要求: (1) 利用SPSS软件求未知参数的点估计; (2) 利用SPSS软件求未知参数的置信区间。 3 、仪器用具及材料: PC机,SPSS软件 4 、实验内容: 一、 测厚仪 有两台测厚仪,由一个人按同一规程

    2024年02月05日
    浏览(16)
  • 统计神经网络参数量、MAC、FLOPs等信息

    1、FLOPS是用来衡量硬件算力的指标,FLOPs用来衡量模型复杂度。 2、MAC 一般为 FLOPs的2倍 3、并非FLOPs越小在硬件上就一定运行更快,还与模型占用的内存,带宽,等有关 神经网络参数量。用于衡量模型大小。一般卷积计算方式为: F L O P s = 2 ∗ H W ( K h ∗ K w ∗ C i n + 1 ) C o u

    2024年02月15日
    浏览(16)
  • 深度学习模型的参数、计算量和推理速度统计

    在没有过拟合的情况下,相同模型结构下,一般模型的参数量和计算量与最终的性能成正比,在比较不同模型性能时,最好能保持模型参数量和计算量在相同水平下,因此相应参数的统计很重要。这里只进行理论计算,最终的效果(内存和速度)还和网络结构,代码实现方式

    2024年01月18日
    浏览(11)
  • 《统计学》——思考题第七章参数估计(贾俊平)

    目录 1、解释估计量和估计值。 2、简述评价估计量好坏的标准。  3、怎样理解置信区间? 4、解释 95%的置信区间。 5、的含义是什么? 6、解释独立样本和匹配样本的含义。 7、在对两个总体均值之差的小样本估计中,对两个总体和样本都有哪些假定?  8、简述样本量与置信

    2024年02月09日
    浏览(14)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包