เรียนสถิติด้วยภาพ ตอนที่ 11 การคำนวณขนาดการสุ่มสำหรับออกแบบการทดลองที่ใช้ t-test

ปัญหาหนึ่งที่คนออกแบบการทดลองจะเจอคือ เมื่อจะประเมินผลโดย t-test ควรกำหนดขนาดของประชากรที่จะสุ่มมาเป็นเท่าไหร่

อันที่จริงก็ไม่ยาก

เราแค่พลิกสมการที่ใช้คำนวณหา t-test นี่เอง กลับด้านเสียหน่อย แทนที่จะหาค่า t เมื่อทราบ N ก็แก้สมการหา N เมื่อกำหนด t

t = (เฉลี่ย1 - เฉลี่ย2)/SE

ตัว SE คือ pooled standard error ซึ่งกล่าวถึงในตอนก่อนหน้า

เรารู้ว่า

SE = SD/รากที่สองของ N

จับแทนที่ จะได้

t = (เฉลี่ย1 - เฉลี่ย2)/[SD/รากที่สองของ N]

แก้สมการ ได้

N = [(t x SD)/(เฉลี่ย1 - เฉลี่ย2)]²

แต่ถ้ามีประเด็นแค่นี้ ก็คงไม่ต้องมาพูดถึงตรงนี้ให้เสียเวลา

เพราะสูตรนี้ยังไม่คลุมผลจากการสุ่มมาน้อย ๆ

ลองดูว่า เกิดอะไรขึ้น หากผมมีข้อมูลของประชากรชุดหนึ่ง ที่จริง ๆ แล้วเป็นเนื้อเดียวกันตลอด แต่ผมสุ่มมาเพียงไม่กี่จุด มาหาค่าเฉลี่ย และช่วงความเชื่อมั่นที่ล้อมรอบประชากรที่สุ่มมา

จะเห็นได้ว่า จุดศูนย์กลาง (ค่าเฉลี่ย) จะกระเพื่อม

และยิ่งไปกว่านั้น รัศมี (ซึ่งบอกถึงขนาดของช่วงความเชื่อมั่น) ก็กระเพื่อมด้วย

นั่นคือ ผมไม่สามารถวางใจเชื่อมั่นทั้งจุดศูนย์กลาง และรัศมีของการกระจายของมันได้ทั้งคู่

ดังนั้น ค่า t ที่ผมจะใช้ ผมจึงไม่สามารถใช้ t ตามปรกติอีกต่อไป

t ตามปรกติ เรียกว่า t_α เป็น t ที่บอกถึงหน่วยวัดระยะห่างของจุดศูนย์กลางการทดลองสองชุด

แต่เนื่องจากมาตรวัดทุกอย่างกระเพื่อมได้เพราะสุ่มมาน้อย ดังนั้น ผมต้องเผื่อผลจากการกระเพื่อมเข้าไปด้วย เรียกว่า t_β

ผมจึงควรใช้ t_α + t_β แทน t ตามปรกติ

N = [((t_α + t_β) x SD)/(เฉลี่ย1 - เฉลี่ย2)]²

สรุปด้วยรูปข้่างล่างนี้อีกที

คำถามที่จะเจอบ่อยก็คือ แล้ว เฉลี่ย1 - เฉลี่ย2 คืออะไร ? เพราะเรายังไม่ได้ทดลองเลย จะไปรู้ได้ไงว่ามันมีค่าเท่าไหร่

ความหมายของ เฉลี่ย1 - เฉลี่ย2 ในที่นี้ ก็คือ ความสามารถในการแยกแยะสองเหตุการณ์ เหมือนกับเป็นขนาดของ pixel ที่ประกอบขึ้นมาเป็นรูปภาพ

อยากเห็นรูปภาพคมชัด บอกรายละเอียดได้ดี ก็ต้องตั้งขนาด pixel ให้เล็ก หรือนั่นคือ ตั้งค่า |เฉลี่ย1 - เฉลี่ย2| ให้น้อย ๆ หน่อย

อยากเห็นรูปภาพคร่าว ๆ ก็ตั้งค่า |เฉลี่ย1 - เฉลี่ย2| ให้มาก ๆ หน่อย

อยากเห็นรูปชัด N ก็จะต้องสูง

อยากเห็นแค่คร่าว ๆ ก็จะได้ N ต่ำ

สนใจอ่าน เรียนสถิติด้วยภาพ แบบครบทุกตอน เข้าไปที่

http://www.gotoknow.org/posts?tag=เรียนสถิติด้วยภาพ

เรียนสถิติด้วยภาพ ตอนที่ 11 การคำนวณขนาดการสุ่มสำหรับออกแบบการทดลองที่ใช้ t-test

ความเห็น

บทความในวันเดียวกัน