สมมุติว่าเราต้องการเดาความสูงเฉลี่ยของนักเรียนทุกคนในโรงเรียนแสงอรุณ แต่การวัดทุกคนนั้นไม่มีโอกาสเป็นไปได้เลย เราจึงสุ่มวัดนักเรียน 100 คน แล้วหาความสูงเฉลี่ยของนักเรียน
แต่เรารู้ว่านี่เป็นเพียงค่าเฉลี่ยที่เป็นไปได้ 1 ค่า หากเราวัดผลนักเรียนอีก 100 คนถัดมา เราอาจได้ค่าเฉลี่ยที่แตกต่างกันเล็กน้อย
ดังนั้น เราใช้การวัดแบบนี้เพื่อสร้างช่วง (เรียกว่าช่วงความเชื่อมั่น) ซึ่งเราแน่ใจ 95% ว่าความสูงเฉลี่ยจริงของนักเรียนทุกคนอยู่ในช่วงนั้น หรือกล่าวว่า "เราไม่สามารถระบุความสูงเฉลี่ยที่แน่นอนได้ แต่เราแน่ใจ 95% ว่าอยู่ในช่วงนี้"
เมื่อนักวิจัยต้องการทราบว่าบางสิ่งบางอย่างน่าจะเป็นจริงหรือไม่หรือเป็นความบังเอิญ เขาก็จะใช้สิ่งที่เรียกว่า p-value
สมมติว่าจอยอ้างว่าเขามีเหรียญวิเศษที่ออกหัวบ่อยกว่าออกก้อย แต่เราไม่เชื่อและตัดสินใจทำการทดสอบดู โดยทำการพลิกเหรียญ 100 ครั้ง เหรียญออกหัว 57 ครั้ง
เราก็เริ่มสงสัยแล้วว่าเป็นเพราะเหรียญเป็นของวิเศษหรือเพราะโอกาสสุ่มโดยบังเอิญ และนี่คือที่มาของค่า p-value
หากเราคำนวณ p-value และได้ค่าน้อยกว่า 0.05 หมายความว่าผลลัพธ์ที่เราเห็น (57 จาก 100 หัว) จะค่อนข้างหายากหากเหรียญนั้นเป็นเพียงเหรียญธรรมดา มันจะเกิดขึ้นน้อยกว่า 5 ครั้งจาก 100 ครั้ง หากเราต้องพลิกเหรียญครั้งแล้วครั้งเล่า ดังนั้นเราจึงอาจสรุปได้ว่าเหรียญนั้นอาจเป็นเหรียญวิเศษได้
แต่ถ้าค่า p มากกว่า 0.05 หมายความว่าการได้มาซึ่งการออกหัว 57 ครั้งอาจเป็นเพราะโอกาสสุ่ม ดังนั้น เราอาจสรุปได้ว่าเหรียญของจอยไม่ใช่ของวิเศษแต่อย่างใด
กล่าวโดยสรุปคือ ช่วงความเชื่อมั่น 95% จะให้ช่วงที่เราคิดว่ามีค่าจริงอยู่ ในขณะที่ค่า p จะบอกเราว่าความแตกต่างที่สังเกตได้น่าจะเป็นจริงหรือเพียงเพราะความบังเอิญ
ไม่มีความเห็น