預(yù)防醫(yī)學(xué)/x2檢驗(yàn)
醫(yī)學(xué)電子書 >> 《預(yù)防醫(yī)學(xué)》 >> 計(jì)數(shù)資料分析 >> x2檢驗(yàn) |
預(yù)防醫(yī)學(xué) |
|
x2檢驗(yàn)(chi-square test)或稱卡方檢驗(yàn),是一種用途較廣的假設(shè)檢驗(yàn)方法??梢苑譃槌山M比較(不配對(duì)資料)和個(gè)別比較(配對(duì),或同一對(duì)象兩種處理的比較)兩類。
目錄 |
一、四格表資料的x2檢驗(yàn)
例20.7某醫(yī)院分別用化學(xué)療法和化療結(jié)合放射治療卵巢癌腫患者,結(jié)果如表20-11,問兩種療法有無差別?
表20-11 兩種療法治療卵巢癌的療效比較
組別 | 有效 | 無效 | 合計(jì) | 有效率(%) |
化療組 | 19 | 24 | 43 | 44.2 |
化療加放療組 | 34 | 10 | 44 | 77.3 |
合計(jì) | 53 | 34 | 87 | 60.9 |
表內(nèi)用虛線隔開的這四個(gè)數(shù)據(jù)是整個(gè)表中的基本資料,其余數(shù)據(jù)均由此推算出來;這四格資料表就專稱四格表(fourfold table),或稱2行2列表(2×2 contingency table)從該資料算出的兩種療法有效率分別為44.2%和77.3%,兩者的差別可能是抽樣誤差所致,亦可能是兩種治療有效率(總體率)確有所不同。這里可通過x2檢驗(yàn)來區(qū)別其差異有無統(tǒng)計(jì)學(xué)意義,檢驗(yàn)的基本公式為:
公式(20.12)
式中A為實(shí)際數(shù),以上四格表的四個(gè)數(shù)據(jù)就是實(shí)際數(shù)。T為理論數(shù),是根據(jù)檢驗(yàn)假設(shè)推斷出來的;即假設(shè)這兩種卵巢癌治療的有效率本無不同,差別僅是由抽樣誤差所致。這里可將兩種療法合計(jì)有效率作為理論上的有效率,即53/87=60.9%,以此為依據(jù)便可推算出四格表中相應(yīng)的四格的理論數(shù)。茲以表20-11資料為例檢驗(yàn)如下。
檢驗(yàn)步驟:
1.建立檢驗(yàn)假設(shè):
H0:π1=π2
H1:π1≠π2
α=0.05
2.計(jì)算理論數(shù)(TRC),計(jì)算公式為:
TRC=nR.nc/n公式(20.13)
式中TRC是表示第R行C列格子的理論數(shù),nR為理論數(shù)同行的合計(jì)數(shù),nC為與理論數(shù)同列的合計(jì)數(shù),n為總例數(shù)。
第1行1列: 43×53/87=26.2
第1行2列: 43×34/87=16.8
第2行1列: 44×53/87=26.8
第2行2列: 4×34/87=17.2
以推算結(jié)果,可與原四項(xiàng)實(shí)際數(shù)并列成表20-12:
表20-12 兩種療法治療卵巢癌的療效比較
組別 | 有效 | 無效 | 合計(jì) |
化療組 | 19(26.2) | 24(16.8) | 43 |
化療加放療組 | 34(26.8) | 10(17.2) | 44 |
合計(jì) | 53 | 34 | 87 |
因?yàn)樯媳砻啃泻兔苛泻嫌?jì)數(shù)都是固定的,所以只要用TRC式求得其中一項(xiàng)理論數(shù)(例如T1.1=26.2),則其余三項(xiàng)理論數(shù)都可用同行或同列合計(jì)數(shù)相減,直接求出,示范如下:
T1.1=26.2
T1.2=43-26.2=16.8
T2.1=53-26.2=26.8
T2.2=44-26.2=17.2
3.計(jì)算x2值 按公式20.12代入
4.查x2值表求P值
在查表之前應(yīng)知本題自由度。按x2檢驗(yàn)的自由度v=(行數(shù)-1)(列數(shù)-1),則該題的自由度v=(2-1)(2-1)=1,查x2界值表(附表20-1),找到x20.001(1)=6.63,而本題x2=10.01即x2>x20.001(1),P<0.01,差異有高度統(tǒng)計(jì)學(xué)意義,按α=0.05水準(zhǔn),拒絕H0,可以認(rèn)為采用化療加放療治療卵巢癌的療效比單用化療佳。
通過實(shí)例計(jì)算,讀者對(duì)卡方的基本公式有如下理解:若各理論數(shù)與相應(yīng)實(shí)際數(shù)相差越小,x2值越?。蝗鐑烧呦嗤?,則x2值必為零,而x2永遠(yuǎn)為正值。又因?yàn)槊恳粚?duì)理論數(shù)和實(shí)際數(shù)都加入x2值中,分組越多,即格子數(shù)越多,x2值也會(huì)越大,因而每考慮x2值大小的意義時(shí)同時(shí)要考慮到格子數(shù)。因此自由度大時(shí),x2的界值也相應(yīng)增大。
二、四格表的專用公式
對(duì)于四格表資料,還可用以下專用公式求x2值。
公式(20.14)
式中a、b、c、d各代表四格表中四個(gè)實(shí)際數(shù),現(xiàn)仍以表20-12為例,將上式符號(hào)標(biāo)記如下(表20-13),并示范計(jì)算。
表20-13 兩種療法治療卵巢腫瘤患者的療效
組別 | 有效 | 無效 | 合計(jì) |
化療組 | 19(a) | 24(b) | 43(a+b) |
化療加放療組 | 34(c) | 10(d) | 44(c+d) |
53(a+c) | 34(b+d) | 87(n) |
計(jì)算結(jié)果與前述用基本公式一致,相差0.01用換算時(shí)小數(shù)點(diǎn)后四舍五入所致。
三、四格表x2值的校正
x2值表是數(shù)理統(tǒng)計(jì)根據(jù)正態(tài)分布中 的定義計(jì)算出來的。 只是一種近似,在自由度大于1、理論數(shù)皆大于5時(shí),這種近似很好;當(dāng)自由度為1時(shí),尤其當(dāng)1<T<5,而n>40時(shí),應(yīng)用以下校正公式:
公式(20.15)
如果用四格表專用公式,亦應(yīng)用下式校正:
公式(20.16)
例20.8某醫(yī)師用甲、乙兩療法治療小兒?jiǎn)渭冃?a href="/w/%E6%B6%88%E5%8C%96%E4%B8%8D%E8%89%AF" title="消化不良">消化不良,結(jié)果如表20-14。試比較兩種療法效果有無差異?
表20-14 兩種療法效果比較的卡方較正計(jì)算
療法 | 痊愈數(shù) | 未愈數(shù) | 合計(jì) |
甲 | 26(28.82) | 7(4.18) | 33 |
乙 | 36(33.18) | 2(4.82) | 38 |
合計(jì) | 62 | 9 | 71 |
從表20-14可見,T1.2和T2.2數(shù)值都<5,且總例數(shù)大于40,故宜用校正公式(20.15)檢驗(yàn)。步驟如下:
1.檢驗(yàn)假設(shè):
H0:π1=π2
H1:π1≠π2
α=0.05
2.計(jì)算理論數(shù):(已完成列入四格表括弧中)
3.計(jì)算x2值:應(yīng)用公式(20.15)運(yùn)算如下:
查x2界值表,x20.05(1)=3.84,故x2<x20.05(1),P>0.05.
按α=0.05水準(zhǔn),接受H0,兩種療效差異無統(tǒng)計(jì)學(xué)意義。
如果不采用校正公式,而用原基本公式,算得的結(jié)果x2=4.068,則結(jié)論就不同了。
如果觀察資料的T<1或n<40時(shí),四格表資料用上述校正法也不行,可參考預(yù)防醫(yī)學(xué)專業(yè)用的醫(yī)學(xué)統(tǒng)計(jì)學(xué)教材中的精確檢驗(yàn)法直接計(jì)算概率以作判斷。
四、行×列表的卡方檢驗(yàn)(x2testfor R×C table)
適用于兩個(gè)組以上的率或百分比差別的顯著性檢驗(yàn)。其檢驗(yàn)步驟與上述相同,簡(jiǎn)單計(jì)算公式如下:
公式(20.17)
式中n為總例數(shù);A為各觀察值;nR和nC為與各A值相應(yīng)的行和列合計(jì)的總數(shù)。
例20.9北方冬季日照短而南移,居宅設(shè)計(jì)如何適應(yīng)以獲得最大日照量,增強(qiáng)居民體質(zhì),減少小兒佝僂病,實(shí)屬重要。胡氏等1986年在北京進(jìn)行住宅建筑日照衛(wèi)生標(biāo)準(zhǔn)的研究,對(duì)214幢樓房居民的嬰幼兒712人體檢,檢出輕度佝僂病333例,比較了居室朝向與患病的關(guān)系?,F(xiàn)將該資料歸納如表20-15作行×列檢驗(yàn)。
表20-15居室朝向與室內(nèi)嬰幼兒佝僂病患病率比較
檢查結(jié)果 | 居室朝向 | 合計(jì) | |||
南 | 西、西南 | 東、東南 | 北、東北、西北 | ||
患病 | 180 | 14 | 120 | 65 | 379 |
無病 | 200 | 16 | 84 | 33 | 333 |
合計(jì) | 380 | 30 | 204 | 98 | 712 |
患病率(%) | 47.4 | 46.7 | 58.8 | 66.3 | 53.2 |
該表資料由2行4列組成,稱2×4表,可用公式(20.17)檢驗(yàn)。
(一)檢驗(yàn)步驟
1.檢驗(yàn)假設(shè)
H0:四類朝向居民嬰幼兒佝僂病患病率相同。
H1:四類朝向居民嬰幼兒佝僂病患率不同。
α=0.05
2.計(jì)算x2值
3.確定P值和分析
本題v=(2-1)(4-3)=3,據(jù)此查附表20-1:
x20.01(3)=11.34,本題x2=15.08,x2>x20.01(3),P<0.01,按α=0.05水準(zhǔn),拒絕H0,可以認(rèn)為居室朝向不同的居民,嬰幼兒佝僂病患病率有差異。
(二)行×列表x2檢驗(yàn)注意事項(xiàng)
1.一般認(rèn)為行×列表中不宜有1/5以上格子的理論數(shù)小于5,或有小于1的理論數(shù)。當(dāng)理論數(shù)太小可采取下列方法處理:①增加樣本含量以增大理論數(shù);②刪去上述理論數(shù)太小的行和列;③將太小理論數(shù)所在行或列與性質(zhì)相近的鄰行鄰列中的實(shí)際數(shù)合并,使重新計(jì)算的理論數(shù)增大。由于后兩法可能會(huì)損失信息,損害樣本的隨機(jī)性,不同的合并方式有可能影響推斷結(jié)論,故不宜作常規(guī)方法。另外,不能把不同性質(zhì)的實(shí)際數(shù)合并,如研究血型時(shí),不能把不同的血型資料合并。
2.如檢驗(yàn)結(jié)果拒絕檢驗(yàn)假設(shè),只能認(rèn)為各總體率或總體構(gòu)成比之間總的來說有差別,但不能說明它們彼此之間都有差別,或某兩者間有差別。
五、配對(duì)計(jì)數(shù)資料x2檢驗(yàn)(x2testof paired comparison of enumeration data)
在計(jì)量資料方面,同一對(duì)象實(shí)驗(yàn)前后差別或配對(duì)資料的比較與兩樣本均數(shù)比較方法有所不同;在計(jì)數(shù)資料方面亦如此。例如表20-16是28份咽喉涂抹標(biāo)本,每份按同樣條件分別接種在甲、乙兩種白喉?xiàng)U菌培養(yǎng)基中,觀察白喉?xiàng)U菌生長(zhǎng)情況,試比較兩種培養(yǎng)基的效果。
表20-16 兩種白喉?xiàng)U菌培養(yǎng)基培養(yǎng)結(jié)果比較
甲培養(yǎng)基 | 乙培養(yǎng)基 | 合計(jì) | |
+ | - | ||
+ | 11(a) | 9(b) | 20 |
- | 1(c) | 7(d) | 8 |
合計(jì) | 12 | 16 | 28 |
從表中資料可見有四種結(jié)果:(a)甲+乙+,(b)甲+乙-(c)甲-乙+,(d)甲-乙-;如果我們目的是比較兩種培養(yǎng)基的培養(yǎng)結(jié)果有無差異,則(a)、(d)兩種結(jié)果是一致的,對(duì)差異比較毫無意義,可以不計(jì),我們只考慮結(jié)果不同的(b)和(c),看其差異有無意義,可以應(yīng)用以下簡(jiǎn)易公式計(jì)算:
公式(20.18)
檢驗(yàn)步驟:
1.檢驗(yàn)假設(shè)
H0:π1=π2
H1:π1≠π2
α=0.05
2.計(jì)算x2值
3.確定P值和分析 配對(duì)資料v=1,查附表20-1得知x20.05(1)=3.84,x2>x0.05(1),P<0.05,按α=0.05水準(zhǔn),拒絕H0,可以認(rèn)為甲培養(yǎng)基的白喉?xiàng)U菌生長(zhǎng)效率較高。
如果b+c>40,則可采用:
公式(20.19)
此外還有兩種以上處理方法的比較,可參閱預(yù)防醫(yī)學(xué)專業(yè)的醫(yī)學(xué)統(tǒng)計(jì)方法有關(guān)章節(jié)。
附表20-1 x2界值表
v | P | V | P | ||||
0.05 | 0.01 | 0.001 | 0.05 | 0.01 | 0.001 | ||
1 | 3.84 | 6.63 | 10.83 | 16 | 26.30 | 32.00 | 39.25 |
2 | 5.99 | 9.21 | 13.81 | 17 | 27.59 | 33.14 | 40.79 |
3 | 7.81 | 11.34 | 16.27 | 18 | 28.87 | 34.18 | 42.31 |
4 | 9.49 | 13.28 | 18.47 | 19 | 30.14 | 36.19 | 43.82 |
5 | 11.07 | 15.09 | 20.52 | 20 | 31.41 | 37.57 | 45.32 |
6 | 12.59 | 16.81 | 22.46 | 21 | 32.67 | 38.93 | 46.80 |
7 | 14.07 | 18.48 | 24.32 | 22 | 33.92 | 40.29 | 48.27 |
8 | 15.51 | 20.09 | 26.12 | 23 | 35.17 | 41.64 | 49.73 |
9 | 16.92 | 21.67 | 27.88 | 24 | 36.42 | 42.98 | 51.18 |
10 | 18.31 | 23.21 | 29.59 | 25 | 37.65 | 44.31 | 52.62 |
11 | 19.68 | 24.72 | 31.26 | 26 | 38.89 | 45.64 | 54.05 |
12 | 21.03 | 26.22 | 32.91 | 27 | 40.11 | 46.96 | 55.48 |
13 | 22.36 | 27.69 | 34.53 | 28 | 41.34 | 48.28 | 56.89 |
14 | 23.68 | 29.14 | 36.12 | 29 | 42.56 | 49.59 | 58.30 |
15 | 25.00 | 30.58 | 37.70 | 30 | 43.77 | 50.89 | 59.70 |
率的假設(shè)檢驗(yàn)——正態(tài)近似法 | 秩和檢驗(yàn) |
關(guān)于“預(yù)防醫(yī)學(xué)/x2檢驗(yàn)”的留言: | 訂閱討論RSS |
目前暫無留言 | |
添加留言 |