สมมติว่าเรามีขวดโหลสองขวดที่มีลูกอมที่มีรูปร่างแตกต่างกัน ขวดแรกมีลูกอมทรงกลม และอีกขวดหนึ่งมีลูกอมหลายรูปทรงและหลายขนาด เราต้องการทราบว่าขวดใดมีลูกอมที่มีขนาดใกล้เคียงกัน เราจึงต้องใช้การวัดการกระจาย
ความแปรปรวน (Variance)
เป็นวิธีการวัดความแตกต่างของลูกอมจากขนาดลูกอมเฉลี่ยในแต่ละขวด หากลูกอมแตกต่างกันมาก ความแปรปรวนจะมากขึ้น หากมีความคล้ายคลึงกันมากขึ้น ความแปรปรวนก็จะน้อยลง
ความแปรปรวน คือ การวัดว่าค่าต่างๆ ในชุดข้อมูลมีการกระจัดกระจายอย่างไร หรือจุดข้อมูลแต่ละจุดแตกต่างจากค่าเฉลี่ยของชุดข้อมูลมากน้อยเพียงใด
ความแปรปรวนสูงหมายความว่าจุดข้อมูลกระจายออกไปมาก ในขณะที่ความแปรปรวนต่ำแสดงว่าข้อมูลใกล้เคียงกับค่าเฉลี่ย
สูตรคำนวณความแปรปรวน
- คำนวณหาค่าเฉลี่ยของชุดข้อมูล
- ลบค่าเฉลี่ยจากจุดข้อมูลแต่ละจุดและยกกำลังสองผลลัพธ์
- บวกผลต่างกำลังสองทั้งหมด
- หารผลรวมด้วยจำนวนจุดข้อมูลลบหนึ่ง (เรียกว่าองศาอิสระ)
ส่วนเบี่ยงเบนมาตรฐาน (Standard Deviation)
เป็นเหมือนวิธีที่ง่ายกว่าในการทำความเข้าใจความแปรปรวน เพราะคือการหาค่ารากที่สองของความแปรปรวน
ค่าเบี่ยงเบนมาตรฐานสูงหมายความว่าข้อมูลกระจัดกระจายออกจากค่าเฉลี่ย ในขณะที่ค่าเบี่ยงเบนมาตรฐานต่ำแสดงว่าข้อมูลใกล้เคียงกับค่าเฉลี่ย
ความแปรปรวน และ ส่วนเบี่ยงเบนมาตรฐาน หรือ การ วัดการกระจายของข้อมูล
ดังนั้น ความแปรปรวนและส่วนเบี่ยงเบนมาตรฐานช่วยให้เราเข้าใจว่า สิ่งที่เหมือนหรือต่างกันในกลุ่มนั้นเป็นอย่างไร และช่วยให้เราเปรียบเทียบระหว่างกลุ่มและดูว่ากลุ่มใดสอดคล้องกันมากกว่าหรือกลุ่มใดมีความหลากหลายมากกว่ากัน
ความแปรปรวนและค่าเบี่ยงเบนมาตรฐานเป็นแนวคิดที่สำคัญในด้านสถิติเพื่อการวิเคราะห์ข้อมูล เนื่องจากช่วยให้เราเข้าใจการกระจายของข้อมูล โดยช่วยแสดงให้เห็นถึงความน่าเชื่อถือและความสอดคล้องของข้อมูล ซึ่งจะเป็นประโยชน์ในการตัดสินใจ การทดสอบสมมติฐาน และการวิเคราะห์อื่นๆ อีก