ระดับความมีนัยสำคัญทางสถิติ (Level of Statistical Significance)


ที่ผมต้องเขียนเรื่องนี้เพราะมักจะมีความสับสนไม่น้อยระหว่าง ‘นัยสำคัญในความหมายทั่วไป กับนัยสำคัญทางสถิติ’ ทั้งนี้เพราะความมีนัยสำคัญในความหมายสามัญทั่วไปกับความมีนัยสำคัญทางสถิติมีความหมายแตกต่างกันอย่างยิ่งมีนัยสำคัญตามความหมายสามัญทั่วไปอย่างยิ่ง 555 กล่าวคือ

หมายความว่า โดยความหมายสามัญทั่วไปคำว่า ‘มีนัยสำคัญ’ แปลว่าสำคัญอย่างยิ่ง หรือชัดเจน แต่ในทางสถิติคำว่า ‘มีนัยสำคัญ’ มีความหมายแค่ ‘ข้อมูลที่พบในการศึกษาจากกลุ่มตัวอย่างมีลักษณะเช่นเดียวกันกับการศึกษาจากประชากรทั้งประชากร’ ที่ระดับนัยสำคัญที่กำหนด เช่น ผู้วิจัยกำหนดนัยสำคัญที่ .05 แปลว่าในการศึกษา 100 ครั้ง ข้อมูลที่พบในกลุ่มตัวอย่างที่ศึกษาจะเป็นเช่นเดียวกันกับประขากร 95 กรณี  หรือถ้าตั้งระดับนัยสำคัญไว้ที่ .01  แปลว่าในการศึกษา 100 ครั้ง ข้อมูลที่พบในกลุ่มตัวอย่างที่ศึกษาจะเป็นเช่นเดียวกันกับประขากร 99 กรณี กรณีเป็นต้น 

ดังนั้นความมีนัยสำคัญทางสถิติไม่ใช่การบอกว่าสิ่งนั้นสำคัญ และการไม่มีนัยสำคัญทางสถิติก็ไม่ได้บอกว่าสิ่งนั้นไม่สำคัญเช่นกัน ส่วน ‘ความมีนัยสำคัญในความหมายสามัญทั่วไป' ถ้าเราบอกว่าเรื่องนั้นมีนัยสำคัญ จะแปลสิ่งนั้นมีความคัญ เช่น ถ้าเราพูดว่าพ่อและแม่ที่ใส่ใจการเรียนของลูกจะทำให้ลูกประสบผลสำเร็จในการเรียน' แปลว่าความใส่ใจของพ่อกับแม่มีผลอย่างสำคัญต่อความสำเร็จในการเรียนของลูก เป็นต้น  

ตอนนี้เรามาพูดกันปัญหาการเขียนรายงานนัยสำคัญทางสถิติของนักวิจัยและนักวิชาการไทยกันต่อซึ่งพบว่า ถ้าผลการวิเคราะห์พบว่าแตกต่างกันอย่างมีนัยสำคัญทางสถิติ จะเขียนรายงานเหมือนกันคือรายงานว่า ‘มีความแตกต่างอย่างมีนัยสำคัญระดับใด (ซึ่งส่วนใหญ่จะตั้งไว้ที่ ระดับ .05 หรือ ระดับ .01’ เช่นรายว่า ‘การเทียบความคิดเห็นของผู้ตอบแบบสอบถามที่มีเพศต่างกันพบว่าแตกต่างกันอย่างมีนัยสำคัญทางสถิติที่ระดับ .05 หรือ .01'  แต่ถ้าพลการวิเคราะห์พบว่าไม่แตกต่างกัน นี่แหละเป็นปัญหา เพราะนักวิจัยหรือนักวิชาการของไทยมีแนวการเขียนรายงานเป็นสองลักษณะ คือ (1) รายงานว่า ‘ไม่แตกต่างกัน’ เช่น ‘การเทียบความคิดเห็นของผู้ตอบแบบสอบถามที่มีเพศต่างกันพบว่าไม่​แตกต่างกัน’ และ (2) เขียนรายงานว่า  'แตกต่างกันอย่างมีไม่นัยสำคัญทางสถิติที่ระดับ .05 หรือ .01' เป็นต้น 

คำถามคือเขียนแบบไหนจึงจะถูก ซึ่งเป็นประเด็นที่นักวิชารทั้งสองกลุ่มของไทยเห็นไม่ตรงกันมานานครับ  สำหรับความเข้าใจของผมนั้นเห็นว่า ‘เขียนได้ทั้งสองแบบ แต่บนฐานคิดที่แตกต่างกัน’ ดังนี้ 

ประการแรกต้องย้อนกับไปดูว่าการทดสอบค่าทางสถิติและการรายงานการวิเคราะห์ค่าความมีนัยสำคัญนั้นคืออะไร คำตอบคือ เป็นการทดสอบว่าค่าสถิติที่พบในการศึกษากลุ่มตัวอย่างนั้นแล้ว เป็นจริงเช่นเดียวกันถ้าศึกษาจากประชากรไหม เช่น คะแนนทดสอบก่อนทดลองใช้วิธีสอน​ A กับคะแนนทดสอบหลังการทดลองไหม  สมมติว่าค่าเฉลี่ยก่อนการทดลองคือ 15.25 และหลังทดลองคือ 17.32 ซึ่งค่าทั้งสองนี้แตกต่างกันเห็นชัด ๆ  ​แต่ผู้วิจัยอยากพิสูจน์ต่อไปว่าเมื่อค่าจากกลุ่มตัวอย่างต่างกัน แล้วคะแนนของประชากรจะแตกต่างกันไหม จึงต้องทดสอบความมีนัยสำคัญทางสถิติ ซึ่งนำไปสู่ประการที่สอง 

ประการที่สองคือ ในการทดสอบความแตกต่างของค่าเฉลี่ยของประชากรนั้น เราทดสอบโดยตรงไม่ได้ เพราะเราไม่ได้ศึกษาจากประขากร (ถ้าศึกษาจากประชากรก็ไม่ต้องทดสอบ เพราะถ้าค่าเฉลี่ยที่ได้แตกต่างกัน ก็คือแตกต่างกัน และถ้าไม่แตกต่างกัน ก็คือไม่แตกต่างกัน) ดังนั้นเวลาทดสอบค่าทางสถิติของประชากร หรือที่เราเรียกว่าการทดสอบความมีนัยสำคัญโดยวิธีการสถิติอ้างอิงนั้นเป็นการทดสอบ ‘ความไม่แตกต่างกัน’ ของค่าสถิติประชากร โดยมีสมมติฐานว่า  ​'แม้ว่าค่าเฉลี่ยที่ได้ในการศึกษาจากกลุ่มตัวอย่างจะต่างกัน (15.25 กับ 17.32) แต่ค่าเฉลี่ยของคะแนนทดสอบก่อนและหลังการทดลองใช้วิธีสอน A ของประชากรไม่แตกต่างกัน (หรอก)'  จึงพิสูจน์สมมติฐานดังกล่าวโดยใช้กระบวนการทางสถิติอ้างอิง (inferential statistics ซึ่งเมื่อก่อนใช้สูตรคำนวณ แต่ปัจจุบันใช้โปรแกรมคำนวณให้) ซึ่งถ้าผลการทดสอบพบว่ามีนัยสำคัญ ก็จะ ‘ปฏิเสธ’ สมมติฐานการทดสอบความมึนัยสำคัญทางสถิติที่ว่าค่าเฉลี่ยของประชากรไม่แตกต่างกัน  ก็เลย ‘ยอมรับ’ สมมติฐานการวิจัยที่ว่าค่าเฉลี่ยการทดสอบก่อนและหลังการทดลองที่พบในกลุ่มตัวอย่างที่แตกต่างกันนั้น แตกต่างกันจริง ถ้าศึกษาจากประชากร 

ดังนั้นกลุ่มนักวิชาการที่เขียนรายงานว่า ‘แตกต่างกันอย่างไม่มีนัยสำคัญทางสถิติ​' นั้น​ ต้องการจะบอกว่าแม้ค่าสถิติที่ได้จากกลุ่มตัวอย่างจะแตกต่างกัน (เช่นค่าเฉลี่ย ดังตัวอย่างข้างบน) แต่ทดสอบความมีนัยสำคัญตามวิธีการของสถิติอ้างอิงแล้วพบว่าไม่แตกต่างกัน (คือเป็นไปตามสมมติฐานการทดสอบค่าสถิติที่บอกว่าค่าเฉลี่ยของประชากรไม่แตกต่างกัน) จึงเขียนว่า ‘แตกต่างกันอย่างไม่มีนัยสำคัญทางสถิติ​ ที่ระดับในการทดสอบ เช่น .05 หรือ .01' ส่วนกลุ่มนักวิชาการที่เขียนว่า ​'ไม่แตกต่างกัน' ต้องการจะบอกว่า ‘แม้ว่าค่าสถิติที่ได้จากกลุ่มตัวอย่างจะแตกต่างกัน แต่เมื่อทดสอบความมีนัยสำคัญตามวิธีการของสถิติอ้างอิงแล้วพบว่าเป็นไปตามสมมติฐานในการทดสอบความมีนัยสำคัญ ที่ระบุว่า ​’ค่าเฉลี่ยของประชากรไม่แตกต่างกัน' ก็รายงานแค่ว่า ‘ไม่แตกต่างกัน’ คือแม้ว่าค่าเฉลี่ยที่ได้ในการศึกษาจากกลุ่มตัวอย่างจะแตกต่างกัน (เช่น 15.25 และ 17.32) แต่ค่าเฉลี่ยของประชากรไม่แตกต่างกัน (ถ้ามีการศึกษาจากประชากร) นั่นเอง 

เมื่อทราบแบบนี้ ก็แล้วแต่ท่านจะเลือกเขียนแบบไหน แต่ขอให้เข้าใจความหมายของการทดสอบความมีนัยสำคัญทางสถิติดังกล่าวมาแล้วข้างต้น แต่ผมคุ้นชินและชอบแบบรายงานแบบว่า 'ถ้าผลการทดสอบความมีนัยสำคัญตามวิธีการทางสถิติอ้างอิงแล้วพบว่ามีนัยสำคัญ  แปลว่าเราปฏิเสธสมมติฐานการทดสอบความมีนัยสำคัญที่ว่า ‘ค่าเฉลี่ยของประชากรไม่แตกต่างกัน และยอมรับสมมติฐานการวิจัยที่ว่าค่าเฉลี่ยมีความแตกต่างกัน’ และเขียนรายงานว่า ‘มีความแตกต่างอย่างมีนัยสำคัญทางสถิติที่ระดับ .05 หรือ .01 ตามที่ตั้งสมมติฐานการวิจัยไว้ แต่ในทางตรงกันข้ามถ้าพบผลการทดสอบความมีนัยสำคัญทางสถิติพบว่า ’ไม่มีนัยสำคัญ'  แปลว่าเรายอมรับสมมติฐานการทดสอบที่ตั้งไว้ว่า  ‘ค่าเฉลี่ยของประชากรไม่แตกต่างกัน’ ก็จะรายงานผลการทดสอบความมีนัยสำคัญทางสถิติว่า ’ไม่แตกต่างกัน' (แม้ค่าเฉลี่ยของกลุ่มตัวอย่างจะแตกต่างกัน แต่ถ้าศึกษาจากประชากรแล้ว ค่าเฉลี่ยของประชากรจะไม่แตกต่างกัน) นั่นเอง 

สมาน อัศวภูมิ 

23 มีนาคม 2566

 

หมายเลขบันทึก: 712059เขียนเมื่อ 23 มีนาคม 2023 23:26 น. ()แก้ไขเมื่อ 24 มีนาคม 2023 07:31 น. ()สัญญาอนุญาต: สงวนสิทธิ์ทุกประการจำนวนที่อ่านจำนวนที่อ่าน:


ความเห็น (0)

ไม่มีความเห็น

อนุญาตให้แสดงความเห็นได้เฉพาะสมาชิก
พบปัญหาการใช้งานกรุณาแจ้ง LINE ID @gotoknow
ClassStart
ระบบจัดการการเรียนการสอนผ่านอินเทอร์เน็ต
ทั้งเว็บทั้งแอปใช้งานฟรี
ClassStart Books
โครงการหนังสือจากคลาสสตาร์ท