ปัญหาหนึ่งที่คนออกแบบการทดลองจะเจอคือ เมื่อจะประเมินผลโดย t-test ควรกำหนดขนาดของประชากรที่จะสุ่มมาเป็นเท่าไหร่
อันที่จริงก็ไม่ยาก
เราแค่พลิกสมการที่ใช้คำนวณหา t-test นี่เอง กลับด้านเสียหน่อย แทนที่จะหาค่า t เมื่อทราบ N ก็แก้สมการหา N เมื่อกำหนด t
t = (เฉลี่ย1 - เฉลี่ย2)/SE
ตัว SE คือ pooled standard error ซึ่งกล่าวถึงในตอนก่อนหน้า
เรารู้ว่า
SE = SD/รากที่สองของ N
จับแทนที่ จะได้
t = (เฉลี่ย1 - เฉลี่ย2)/[SD/รากที่สองของ N]
แก้สมการ ได้
N = [(t x SD)/(เฉลี่ย1 - เฉลี่ย2)]2
แต่ถ้ามีประเด็นแค่นี้ ก็คงไม่ต้องมาพูดถึงตรงนี้ให้เสียเวลา
เพราะสูตรนี้ยังไม่คลุมผลจากการสุ่มมาน้อย ๆ
ลองดูว่า เกิดอะไรขึ้น หากผมมีข้อมูลของประชากรชุดหนึ่ง ที่จริง ๆ แล้วเป็นเนื้อเดียวกันตลอด แต่ผมสุ่มมาเพียงไม่กี่จุด มาหาค่าเฉลี่ย และช่วงความเชื่อมั่นที่ล้อมรอบประชากรที่สุ่มมา
จะเห็นได้ว่า จุดศูนย์กลาง (ค่าเฉลี่ย) จะกระเพื่อม
และยิ่งไปกว่านั้น รัศมี (ซึ่งบอกถึงขนาดของช่วงความเชื่อมั่น) ก็กระเพื่อมด้วย
นั่นคือ ผมไม่สามารถวางใจเชื่อมั่นทั้งจุดศูนย์กลาง และรัศมีของการกระจายของมันได้ทั้งคู่
ดังนั้น ค่า t ที่ผมจะใช้ ผมจึงไม่สามารถใช้ t ตามปรกติอีกต่อไป
t ตามปรกติ เรียกว่า tα เป็น t ที่บอกถึงหน่วยวัดระยะห่างของจุดศูนย์กลางการทดลองสองชุด
แต่เนื่องจากมาตรวัดทุกอย่างกระเพื่อมได้เพราะสุ่มมาน้อย ดังนั้น ผมต้องเผื่อผลจากการกระเพื่อมเข้าไปด้วย เรียกว่า tβ
ผมจึงควรใช้ tα + tβ แทน t ตามปรกติ
N = [((tα + tβ) x SD)/(เฉลี่ย1 - เฉลี่ย2)]2
สรุปด้วยรูปข้่างล่างนี้อีกที
คำถามที่จะเจอบ่อยก็คือ แล้ว เฉลี่ย1 - เฉลี่ย2 คืออะไร ? เพราะเรายังไม่ได้ทดลองเลย จะไปรู้ได้ไงว่ามันมีค่าเท่าไหร่
ความหมายของ เฉลี่ย1 - เฉลี่ย2 ในที่นี้ ก็คือ ความสามารถในการแยกแยะสองเหตุการณ์ เหมือนกับเป็นขนาดของ pixel ที่ประกอบขึ้นมาเป็นรูปภาพ
อยากเห็นรูปภาพคมชัด บอกรายละเอียดได้ดี ก็ต้องตั้งขนาด pixel ให้เล็ก หรือนั่นคือ ตั้งค่า |เฉลี่ย1 - เฉลี่ย2| ให้น้อย ๆ หน่อย
อยากเห็นรูปภาพคร่าว ๆ ก็ตั้งค่า |เฉลี่ย1 - เฉลี่ย2| ให้มาก ๆ หน่อย
อยากเห็นรูปชัด N ก็จะต้องสูง
อยากเห็นแค่คร่าว ๆ ก็จะได้ N ต่ำ
สนใจอ่าน เรียนสถิติด้วยภาพ แบบครบทุกตอน เข้าไปที่
http://www.gotoknow.org/posts?tag=เรียนสถิติด้วยภาพ
สวัสดีปีใหม่ครับ คุณวิบุล