导航: 生物谷 >> 生物 >> 生物教程 >> Stata入门教程 >> 生物频道正文
  

Stata第六章 卡方检验

2007-6-25 1:33:50 信息来源: 医学统计之星 
  •   Stata第六章 卡方检验
http://www.bioon.com 生 物 谷 网 站

本节STATA 命令摘要

[by 分层变量名:]tab2变量1变量2[,allchi2exactcellcolumnrow]

tabi#11#12[...]\[#21#22[...][\...][,allchi2exactcellcolumnrow]

·列联表分析

STATA命令:

[by分层变量:]tab2变量1变量2[,allchi2lichi2exactcellcolumnrow]

上述命令中,变量1为行计数变量;变量2为列计数变量;all表示 卡方(c2)检验,似然比(likelihoodratio)检验 以及一些统计描述指标和检验,但不包括Fisher精确检验;exact表示Fisher精确检验;chi2表示 c2检验;lichi2表示likelihoodratio检验;cell表示输出的列联表中显示每个观察计数值占该列联表总观察计数值的比例;row表示输出的列联表中显示每个观察计数值占该观察计数值所在行的各观察计数值总数的比例;coloumn表示输出的列联表中显示每个观察计数值占该观察计数值所在的列各观察计数值总数的比例。

例:某地调查肝癌病人与健康人饮用醋冷水(一种以冷水和醋为主要成分的饮料)的习惯。用group=1表示肝癌组患者和group=2表示健康 人;用custom=1表示经常饮用醋冷水;custom=2表示偶尔饮用醋冷水和custom=3表示从不饮用醋冷水。具体资料为:(摘自医学统计方法,金丕焕主编,p163)。

 组别

 经常

 偶尔

 从不饮用

 合计

 肝癌组

26

44

28

98

 健康组

28

49

17

94

 合计

54

93

45

192

 显然这是一个病例对照研究,所以每组人数是人为确定的,因此只需计算各组"经常","偶而"和"从不饮用"占本组的频数以及检验患肝癌是否与饮 水习惯有关。

tab2  groupcustom,rowchi2

->tabulationofgroupbycustom

|custom

group|123|Total

-----------+--------------------------------------------+----------

1|           264428|98

|        26.5344.9028.57|100.00

-----------+--------------------------------------------+----------

2|           284917|94

|        29.7952.1318.09|100.00

-----------+--------------------------------------------+----------

Total|       549345|192

|         28.1248.4423.44|100.00

Pearsonchi2(2)=2.9497Pr=0.229

①该行表示第一组(肝癌组)的3个观察数;②该行表示第一组的各 个观察数的占第一组观察总数的百分比;③该行表示第二组(健康组)的3个观察数;④该行表示第二组的各 个观察数的占第二组观察总数的百分比;⑤该行表示关于饮用醋冷水习惯的三个分类:经常偶尔从不的合计数;⑥该行表示上述三个合计数分别占总样本数的百分比。

从上述结果可知:卡方值为2.9497以及自由度为2,p为0.229,所以根据当前资料和结果显示:患肝癌病与是否饮用醋冷水无关。

·       列联表分析也可以用立即命令执行:

tabi#11#12[...]\[#21#22[...][\...][,allchi2exactcellcolumnrow]

#11数;#12数;\行;#21数,推。令:allchi2exactcellcolumnrow同。

例:STATA为:

tabi264428\284917,chi2lichi2

|col

row|123|Total

-----------+----------------------------------+----------

1|264428|98

|26.5344.9028.57|100.00

-----------+----------------------------------+----------

2|284917|94

|29.7952.1318.09|100.00

-----------+----------------------------------+----------

Total|549345|192

|28.1248.4423.44|100.00

Pearsonchi2(2)=2.9497Pr=0.229

likelihood-ratiochi2(2)=2.9760Pr=0.226

同。明: 是,卡(Pearsonchi2test)(likelihoodratiochi2test)致。

·       Fisher

例:()问:同?(计,编,p165)

 

 

 

 

 

4(2.2)

2(3.8)

6

 

0(1.8)

5(3.2)

5

 

4

7

11

(即:两Ho)

5Fisher法。STATA为:

tabi42\05,exactcolrow

|col

row|12|Total

------------+--------------------------+----------

1|42|6

|66.6733.33|100.00

|100.0028.57|54.55

-----------+---------------------------+----------

2|05|5

|0.00100.00|100.00

|0.0071.43|45.45

-----------+----------------------------+----------

Total|47|11

|36.3663.64|100.00

|100.00100.00|100.00

            Fisher'sexact=0.061

 1-sidedFisher'sexact=0.045

Fisher验;②Fisher

在Fisher精确检验中,假定每列和每行的合计数都是常数情况下,计算相应概率。 在本例中,单侧Fisher检验要计算下表的概率:

4

2

6

0

5

5

4

7

11

双侧Fisher检验是考虑可能新药优于旧药,也可能旧药优于新药的情况。以新药治愈人数为例:观察数-理论数=

5-3.2=1.8,因此要考虑观察数大于理论数的差是考虑抽样误差引起的,所以不仅要计算所有观察数-理论数(3.2)大于1.8的p值[1],还要计算所有理论数(3.2)-观察数大于1.8的p值。即:计算所有|理论数-观察数|>1.8的p值的和,因此在每列和每行的合计数都是常数情况 的假定下,还有一种情况满足理论数(3.2)-观察数大于1.8:

0

6

6

4

1

5

4

7

11

所以本例Fisher双侧检验的p值为0.04545+0.01515»0.061。

·       由于Fisher检验是在每列和每行的合计数都是常数的假定下的精确检验,而对于一般的研究:如病例对照(仅病例组和对照组的人数是常数,即:仅每行的合计数是常数),横断面抽样调查(样本总数是常数),所以对于不满足每列和每行的合计数都是常数假定的资料而言,Fisher检验也是一种近似检验。



[1]本例中只有上述的这张表的情况,所以单侧Fisher检验仅计算该表的p值:观察数-理论数>1.8的p值,类似t检验:单侧检验的p值为t分布曲线下大于t样本计算值的面积,双侧检验的p值为 t分布曲线下大于t样本计数值的面积和小于-t样本计数值的面积之和,而Fisher双侧检验:计算|观察剩-理论数|>1.8的p值的和。即:在本例中,观察数-理论数=1.8相应t检验中的t样本计算值。

http://www.bioon.com 生物谷网站
生物频道录入:admin    责任编辑:admin 
评论】【收藏】【告诉好友】【打印】 【返回顶部】 【直达首页】 【网站地图】 【进入论坛】 
生物谷生物频道,更多精彩在首页,
我来评两句 用户名: * 游客填写 ·注册用户

推荐信息
推荐产品
最新资讯

推荐文章

关于我们 | 广告服务 | 联系方式 | 帮助信息 | 服务条款 | 法律声明 | 战略伙伴 | 友情链接 | 生意通 | 网站地图 | Bioon English
Copyright © 2001-2007 生物谷 bioon.com , All Rights Reserved. 版权所有
不良信息举报信箱:editor#bioon.com
网站备案:沪ICP备05022939号