เรื่องหนึ่ง ที่คนต้องนำสถิติไปใช้ มักจะงง ว่าทำไมเวลาเปรียบเทียบข้อมูลสองกลุ่ม ต้องใช้ p-value ทั้งที่ตาเห็นชัด ๆ ว่าตัวเลขเป็นคนละเรื่อง ซึ่งเวลาต้องอธิบายประเด็นนี้แบบเร่งรัด เพื่อปรับพื้นฐานให้คนที่เรื้อไปนาน ๆ เป็นฝันร้ายสำหรับคนสอนทีเดียว
ผมลองใช้ภาพแบบแปลกแหวกแนวออกไปมาอธิบาย โดยใช้แนวคิดแบบ "หลวม ๆ" ให้ฟังครั้งเดียวก็นึกภาพออกเลย แล้วไล่ไปอ่านนิยามละเอียดเองทางสถิติ
คือเหมือนกับเรามองดาวแฝดคู่หนึ่ง ที่อยู่ชิดกันมาก
ในคืนฟ้าเวิ้งใสสีม่วงคราม ฟ้าไร้เมฆ เราจะเห็นเป็นดาวสองดวงแยกขาดออกมาชัดเจน
แต่คืนไหนมีสภาพอากาศขุ่นมัวมาก ความฝ้ามัวของอากาศ จะทำให้เรามองเห็นแค่จุดแสงเป็นฝ้าอย่างรางเลือน ซึ่งเราจะมองเห็นดาวแฝดเช่นว่านั้น เป็นจุดเพียงจุดเดียว ไม่สามารถแยกจากกันได้
กรณีที่ฝ้ามัวมาก (ความแปรปรวนของการวัดสูง) จะเห็นแสงฝ้ามัวซ้อนเหลื่อมกันสูง (p-value สูง) ทำให้เราไม่สามารถแยกดาวทั้งคู่ออกจากกันได้ เห็นเสมือนหนึ่งเป็นดาวดวงเดียวกัน (ข้อมูลสองชุดซ้อนเกยกันมาก จนแยกจากกันไม่ได้ ถือว่า ข้อมูลทั้งสองชุด ไม่สามารถแยกขาดจากกัน หรือเรียกว่า ไม่มีความแตกต่างทางสถิติ)
แต่ถ้าไม่ฝ้ามัวเลย เราเห็นชัดว่า เป็นดาวคู่ เพราะไม่มีส่วนซ้อนเกยกันเลย (p-value ต่ำ หรือเกือบเป็นศูนย์ หรือนั่นคือ มีความแตกต่างกันทางสถิติ)
ไม่ว่าต่างทางสถิติหรือไม่ ระยะห่างจริงของดาวทั้งคู่ ก็เหมือนเดิมโดยตลอด ไม่เปลี่ยนแปลงเลย
หรือพูดในมุมกลับ ระยะห่างจริงของดาวทั้งคู่จะเป็นเท่าไหร่ก็ตาม เป็นคนละเรื่องกับการแตกต่างทางสถิติ (=ค่าเฉลี่ยของข้อมูลสองชุด ต่างกันจริงเท่าไหร่ก็ตาม เป็นคนละเรื่องกันกับการสรุปว่าต่างทางสถิติ)
สวัสดีครับ พี่ sasinanda
โอ้ เพิ่งพอจะเข้าใจค่ะ
ตอนเรียนอาจารย์บอกว่า "We cannot accpet Ho", however we can only say that " We cannot reject Ho" ค่ะ
ยังไงก็ขอบพระคุณมากๆนะคะ