สอนด้วยภาพ: p-value

เรื่องหนึ่ง ที่คนต้องนำสถิติไปใช้ มักจะงง ว่าทำไมเวลาเปรียบเทียบข้อมูลสองกลุ่ม ต้องใช้ p-value ทั้งที่ตาเห็นชัด ๆ ว่าตัวเลขเป็นคนละเรื่อง ซึ่งเวลาต้องอธิบายประเด็นนี้แบบเร่งรัด เพื่อปรับพื้นฐานให้คนที่เรื้อไปนาน ๆ เป็นฝันร้ายสำหรับคนสอนทีเดียว

ผมลองใช้ภาพแบบแปลกแหวกแนวออกไปมาอธิบาย โดยใช้แนวคิดแบบ "หลวม ๆ" ให้ฟังครั้งเดียวก็นึกภาพออกเลย แล้วไล่ไปอ่านนิยามละเอียดเองทางสถิติ

คือเหมือนกับเรามองดาวแฝดคู่หนึ่ง ที่อยู่ชิดกันมาก

ในคืนฟ้าเวิ้งใสสีม่วงคราม ฟ้าไร้เมฆ เราจะเห็นเป็นดาวสองดวงแยกขาดออกมาชัดเจน

แต่คืนไหนมีสภาพอากาศขุ่นมัวมาก ความฝ้ามัวของอากาศ จะทำให้เรามองเห็นแค่จุดแสงเป็นฝ้าอย่างรางเลือน ซึ่งเราจะมองเห็นดาวแฝดเช่นว่านั้น เป็นจุดเพียงจุดเดียว ไม่สามารถแยกจากกันได้

p-value

กรณีที่ฝ้ามัวมาก (ความแปรปรวนของการวัดสูง) จะเห็นแสงฝ้ามัวซ้อนเหลื่อมกันสูง (p-value สูง) ทำให้เราไม่สามารถแยกดาวทั้งคู่ออกจากกันได้ เห็นเสมือนหนึ่งเป็นดาวดวงเดียวกัน (ข้อมูลสองชุดซ้อนเกยกันมาก จนแยกจากกันไม่ได้ ถือว่า ข้อมูลทั้งสองชุด ไม่สามารถแยกขาดจากกัน หรือเรียกว่า ไม่มีความแตกต่างทางสถิติ)

แต่ถ้าไม่ฝ้ามัวเลย เราเห็นชัดว่า เป็นดาวคู่ เพราะไม่มีส่วนซ้อนเกยกันเลย (p-value ต่ำ หรือเกือบเป็นศูนย์ หรือนั่นคือ มีความแตกต่างกันทางสถิติ)

ไม่ว่าต่างทางสถิติหรือไม่ ระยะห่างจริงของดาวทั้งคู่ ก็เหมือนเดิมโดยตลอด ไม่เปลี่ยนแปลงเลย

หรือพูดในมุมกลับ ระยะห่างจริงของดาวทั้งคู่จะเป็นเท่าไหร่ก็ตาม เป็นคนละเรื่องกับการแตกต่างทางสถิติ (=ค่าเฉลี่ยของข้อมูลสองชุด ต่างกันจริงเท่าไหร่ก็ตาม เป็นคนละเรื่องกันกับการสรุปว่าต่างทางสถิติ)

เขียนใน GotoKnow โดย wwibul
ใน ใบไม้ผลิ

คำสำคัญ (Tags): #p-value#คิดด้วยภาพ#สถิติ

หมายเลขบันทึก: 148264เขียนเมื่อ 21 พฤศจิกายน 2007 21:29 น. ()แก้ไขเมื่อ 6 กันยายน 2013 18:34 น. ()สัญญาอนุญาต: จำนวนที่อ่าน

ความเห็น (5)

sasinanda

เขียนเมื่อ 21 พฤศจิกายน 2007 21:58 น. ()

. sasinanda

การประมาณค่าสมาการแบบนี้ ใช้กับอะไรได้บ้างคะที่เราคุ้นเคยกันดี เช่น เรื่องรายได้ รายจ่าย เรื่องเศรษฐกิจ เป็นต้น

wwibul

เขียนเมื่อ 21 พฤศจิกายน 2007 23:06 น. ()

สวัสดีครับ พี่ sasinanda

p-value เรามักเจอตอนอ่านรายงานทางการทั้งหลาย โดยเฉพาะสายวิทยาศาสตร์ จะเจอมาก สายสังคมศาสตร์ ก็พอจะเห็นบ้าง ซึ่งมักเจอในงานวิจัยที่เอาจริงเอาจังมากเป็นบางชิ้น
เช่น บอกว่า ยานี้ลดความปวดได้ต่างจากการให้กินยาหลอก (เม็ดยาเหมือนกัน แต่อีกเม็ด ไม่ใส่ยา มีแต่แป้ง) เขาก็จะบอกว่า ผลต่างกันไหม ทางสถิติ โดยวงเล็บค่า p-value ไว้ ถ้าเราเห็น p-value น้อย ๆ แสดงว่า สถิติถือว่า ข้อมูลจากยาจริง กับข้อมูลจากยาหลอก เป็นคนละเรื่องกัน (ต่อให้ดูแต่ตัวเลขเผิน ๆ เราอาจรู้สึกว่ามันใกล้กันก็ตาม)
ปรกติแล้ว เวลาอ่าน ต้องดูว่า สถิติต่างกันไหม ถ้าต่างกัน ค่อยมาดูกันต่อว่า ที่ต่างกันนั้น เราประทับใจไหม
แต่ถ้าสถิติบอกว่า ไม่ต่างกัน แสดงว่า ยังไม่มีข้อสรุป (เทียบได้กับกรณีที่ฟ้ามัวจนมองอะไรไม่เห็น หรือไม่อีกอย่าง ก็คือ จริง ๆ แล้วมีดาวอยู่ดวงเดียว แต่แสงมันหลอกตาเราให้รู้สึกราวกับมีสองดวง) แบบนั้น ก็อย่าเพิ่งรีบสรุป แม้ว่าจะเห็นตัวเลขเสมือนหนึ่งต่างกันมากก็ตาม
พูดง่าย ๆ ก็คือ สิ่งที่เรารู้สึกว่าต่าง กับสิ่งที่สถิติบอกว่าต่าง อาจเป็นคนละเรื่อง
อ่านผลเป็น จะทำให้เรามีเครื่องมือเพิ่ม ในการช่วยคุ้มครองตัวเองจากการถูกหลอกแบบเป็นตุเป็นตะที่ใช้วิทยาศาสตร์เทียมบังหน้าครับ

tan

เขียนเมื่อ 4 ธันวาคม 2007 23:17 น. ()

ช่วยให้เข้าใจได้ง่ายขึ้นอย่างมากเลยครับ เอาไปช่วยอธิบายในวิชา Biostatistic น่าจะดีครับ เพราะตอนเรียนงงมากๆ ต้องมาอ่านเองตั้งหลายรอบกว่าจะเข้าใจ

ภูสุภา

เขียนเมื่อ 11 กรกฎาคม 2008 21:48 น. ()

โอ้ เพิ่งพอจะเข้าใจค่ะ

toothfairy

เขียนเมื่อ 6 กุมภาพันธ์ 2015 21:15 น. ()

ตอนเรียนอาจารย์บอกว่า "We cannot accpet Ho", however we can only say that " We cannot reject Ho" ค่ะ

ยังไงก็ขอบพระคุณมากๆนะคะ