Hypergeometric Distribution, Fisher's Exact Test, Sampling without replacement

Hypergeometric distribution ​เช่น การชักไพ่ A ออกจากสำรับ 1 ใบ แบบ without replacement

Hypergeometric distribution
นำ 1 มาลบออกจากตัวแปร ที่มีค่าน้อยที่ไม่ใช่ 0 โดยกำหนดให้ผลรวมของ Row และ Column คงที่
เช่น การชักไพ่ A ออกจากสำรับ 1 ใบ แบบ without replacement
จำนวน A ที่อาจจะเหลือ อยู่ในสำรับ คือ 4, 3, 2, 1, 0
จึงนำ probability ของ การที่มี A เหลืออยู่ในกองของไพ่ 4, 3, 2, 1, 0, มาบวกกัน

การผ่าตัดเปลี่ยนหัวใจและการรอดชีวิต

Ho: การผ่าตัดและไม่ผ่าตัดการรอดชีวิตไม่ต่างกัน
Ha: การผ่าตัดและไม่ผ่าตัดการรอดชีวิตต่างกัน

1 ปีต่อมา รอดชีวิต
ใช่ ไม่ใช่
ผ่าตัด
4 1
ไม่ผ่าตัด 1 3

p = 5! 4! 4! 5! / 9! 4! 1! 1! 3!

p = 5x2 / 9x7
p = 10 / 63
p = 0.159 (1-sided)

กลุ่มที่ทำผ่าตัดมี 4+1 คน ถ้าหากว่าการทำผ่าตัด เป็น 5 + 0 คน

1 ปีต่อมา รอดชีวิต
ใช่ ไม่ใช่
ผ่าตัด
5 0
ไม่ผ่าตัด 0 4

p = 5! 4! 4! 5! / 9! 5! 0! 0! 4!
p = 5! 4! / 9!
p = 1 / 126
p = 0.008 (1-sided)

ใช้วิธี Hypergeometric Distribution

p โดยทำผ่าตัด คือ ผ่าตัดรอดชีวิต 4 คน เสียชีวิต 1
p ถ้าหากว่า ผ่าตัดและรอดรอดชีวิต 5 คน เสียชีวิต 0 คน (more extreme)
p = 0.159 + 0.008
p = 0.167 (1-sided)
p = 0.334 (2-sided)

ไม่สามารถปฏิเสธ Ho

source: Jan W. Kuzma, Stephen E. Bohnenblust. Basic Statistics for the Health Sciences. p272-273



Hypergeometric distribution


2x2 table ระหว่างตัวแปรวิธีรักษา (fecal, vanco) และการหายป่วย (sick, cured)
Ho: วิธีรักษาและการหายป่วย ไม่มี Association
Ha: วิธีรักษาและการหายป่วย มี Association
และแนะนำว่า hypothesis แบบ 2-sides จะเหมาะสมกว่า

บทความเขียนว่า "hypogeometric distribution (please don't ask me to explain it)"
คำนี้น่าจะเป็น hypergeometric distribution
ซึ่งรวมค่า p-value (1-sided) เข้าด้วยกัน โดยที่ sick people 4, 3, 2, 1, 0
และปรับค่าให้เป็น p-value (2-sided)

"There are several different techniques, but the most common is to add together the probabilities of all combinations that have lower probabilities than that of the observed data. Martín Andrés and Herranz Tejedor (1995) did some computer simulations that show that this is the best technique, and it's the technique used by SAS and most of the web pages I've seen. "
source: http://www.biostathandbook.com/fishers.html



"The hypergeometric distribution applies to sampling without replacement from a finite population whose elements can be classified into two mutually exclusive categories like Pass/Fail, Female/Male or Employed/Unemployed. As random selections are made from the population, each subsequent draw decreases the population causing the probability of success to change with each draw."

source: http://en.wikipedia.org/wiki/Hypergeometric_distri...



ตาราง 2x2 table มีค่า degree of freedom = 1
ถ้าตัวแปรตัวใดตัวหนึ่ง (ที่เป็นเลขจำนวนนับ) เช่น a เปลี่ยนค่าไปจากเดิม
ตัวแปร b c d จะเปลี่ยนตาม เพื่อทำให้ a+b, c+d, a+c, b+d ยังคงที่


บันทึกนี้เขียนที่ GotoKnow โดย  ใน EPISTAT



ความเห็น (0)