การทดสอบการแจกแจง Komogorov-Smirnov test          

หลังการทดสอบการเป็นตัวแปรสุ่มของข้อมูลแล้ว สิ่งที่ต้องพิจารณาต่อไปคือ ตัวแปรมีการแจกแจงปกติหรือไม่ จากนั้นจึงจะได้ทดสอบทางสถิติอื่นๆต่อไป การทดสอบการแจกแจงปกติ มีวิธีทดสอบที่ใช้กันอยู่ คือ การทดสอบไคว์สเควร์ (Chi-squared test) แต่การทดสอบนี้ใช้ได้ดีกับข้อมูลที่มีจำนวนมาก ปกติการทดสอบทางวิทยาศาสตร์จะไม่มีข้อมูลมากนัก   Komogorov-Smirnov test  จึงเป็นวิธีทดสอบที่เหมาะสมกับการทดสอบที่มีจำนวนข้อมูลไม่มาก การตรวจสอบอย่างง่ายๆ ว่าตัวแปรมาจากการแจกแจงปกติหรือไม่ ใช้การ plot cuvre ของเปอร์เซ็นต์ของความถี่สะสมของการวัด เทียบกับค่าของการวัด (Normal Probability Plot)  หากโค้งที่ได้มีรูปร่างคล้ายอักษร S จะสรุปได้ว่าตัวแปรมีการแจกแจงปกติ

            วิธีการทดสอบโดยวิธี Komogorov-Smirnov test   ใช้เปรียบเทียบค่าของการแจกแจงความถี่สะสมของข้อมูลที่ทดสอบ (Empirical Distribution)  กับค่าของการแจกแจงที่ต้องการทดสอบ คือ การแจกแจงปกติ    ค่าสถิติ ค่าที่มากสุดของค่าความแตกต่างของค่าทั้งสอง    การทดสอบทำได้ได้สองลักษณะ  ลักษณะแรกทดสอบว่าการแจกแจงนั้นเป็นการแจกแจงปกติที่สงสัยหรือไม่ โดยที่ทราบค่าเฉลี่ย และค่าส่วนเบี่ยงเบนมาตรฐาน  ลักษณะที่สองทดสอบว่าเป็นการแจกแจงปกติหรือไม่ ข้อมูล   เป็นข้อมูลเชิงปริมาณ มีระดับมาตรการวัด  มาตราอัตราส่วน (Ratio scale) คือ การให้สัญลักษณ์ของข้อมูลที่เป็นตัวเลข แสดงปริมาณ  สามารถนำมาบวก ลบ คูณ หรือ หาร กันได้ สมมติฐาน สมมติฐานหลัก                    H0 : ตัวแปรมีการแจกแจงปกติ สมมติฐานรอง                     H1 : ตัวแปรไม่มีการแจกแจงปกติ  

วิธีทดสอบ

1.       เรียงข้อมูลจากน้อยไปมาก

2.       แปลงข้อมูลแต่ละค่าให้เป็นคะแนน Z โดยใช้สูตร

3.       หาค่าความถี่สะสม F(z)  ของการแจกแจงปกติจากตาราง Z

4.       หาค่าความถี่สะสมที่ได้จากการทดลอง ECDF(z)   

5.       เปรียบเทียบ หาค่าความแตกต่างสูงสุดของค่าทั้งสอง  ให้เป็น Dmax

Dmax  = | F(z) – ECDF(z) }

6.       เปรียบกับค่าในตาราง The Komogorov test for normality

7.       สรุปผล ยอมรับสมมติฐาน ถ้า Dmax  น้อยกว่าค่าจากตาราง

 

ตัวอย่าง  ผลการวัดโดย Spectrophotometer 15 ครั้ง   ได้ผลดังนี้  .3410   .3350   .3470   .3590   .3530   .3460   .3470   .3460   .3430   .3420   .3560   .3500   .3630   .3530   และ .3480  จงทดสอบว่า

1.       ข้อมูลมีการแจกแจงปกติ

2.       ข้อมูลมีการแจกแจงปกติที่มีค่าเฉลี่ยเท่ากับ 0.35  ml. และส่วนเบี่ยงเบนมาตรฐาน 0.005 ml.

   การตรวจสอบอย่างง่าย โดยใช้ Normal Probability Plot  ใช้เครื่องมือใน data analysis ของ MS Excel  ได้กราฟ ดังนี้

                 กราฟมีรูปร่างคล้ายตัวอักษร S จึงสรุปได้ว่าข้อมูลมีการแจกแจงปกติ