สมมติว่าเรามีขวดโหลสองขวดที่มีลูกอมที่มีรูปร่างแตกต่างกัน ขวดแรกมีลูกอมทรงกลม และอีกขวดหนึ่งมีลูกอมหลายรูปทรงและหลายขนาด เราต้องการทราบว่าขวดใดมีลูกอมที่มีขนาดใกล้เคียงกัน เราจึงต้องใช้การวัดการกระจาย

ความแปรปรวน (Variance)

เป็นวิธีการวัดความแตกต่างของลูกอมจากขนาดลูกอมเฉลี่ยในแต่ละขวด หากลูกอมแตกต่างกันมาก ความแปรปรวนจะมากขึ้น หากมีความคล้ายคลึงกันมากขึ้น ความแปรปรวนก็จะน้อยลง

ความแปรปรวน คือ การวัดว่าค่าต่างๆ ในชุดข้อมูลมีการกระจัดกระจายอย่างไร หรือจุดข้อมูลแต่ละจุดแตกต่างจากค่าเฉลี่ยของชุดข้อมูลมากน้อยเพียงใด 

ความแปรปรวนสูงหมายความว่าจุดข้อมูลกระจายออกไปมาก ในขณะที่ความแปรปรวนต่ำแสดงว่าข้อมูลใกล้เคียงกับค่าเฉลี่ย

สูตรคำนวณความแปรปรวน

  • คำนวณหาค่าเฉลี่ยของชุดข้อมูล
  • ลบค่าเฉลี่ยจากจุดข้อมูลแต่ละจุดและยกกำลังสองผลลัพธ์
  • บวกผลต่างกำลังสองทั้งหมด
  • หารผลรวมด้วยจำนวนจุดข้อมูลลบหนึ่ง (เรียกว่าองศาอิสระ)

ส่วนเบี่ยงเบนมาตรฐาน (Standard Deviation)

เป็นเหมือนวิธีที่ง่ายกว่าในการทำความเข้าใจความแปรปรวน เพราะคือการหาค่ารากที่สองของความแปรปรวน 

ค่าเบี่ยงเบนมาตรฐานสูงหมายความว่าข้อมูลกระจัดกระจายออกจากค่าเฉลี่ย ในขณะที่ค่าเบี่ยงเบนมาตรฐานต่ำแสดงว่าข้อมูลใกล้เคียงกับค่าเฉลี่ย

ความแปรปรวน และ ส่วนเบี่ยงเบนมาตรฐาน หรือ การ วัดการกระจายของข้อมูล

ดังนั้น ความแปรปรวนและส่วนเบี่ยงเบนมาตรฐานช่วยให้เราเข้าใจว่า สิ่งที่เหมือนหรือต่างกันในกลุ่มนั้นเป็นอย่างไร และช่วยให้เราเปรียบเทียบระหว่างกลุ่มและดูว่ากลุ่มใดสอดคล้องกันมากกว่าหรือกลุ่มใดมีความหลากหลายมากกว่ากัน

ความแปรปรวนและค่าเบี่ยงเบนมาตรฐานเป็นแนวคิดที่สำคัญในด้านสถิติเพื่อการวิเคราะห์ข้อมูล เนื่องจากช่วยให้เราเข้าใจการกระจายของข้อมูล โดยช่วยแสดงให้เห็นถึงความน่าเชื่อถือและความสอดคล้องของข้อมูล ซึ่งจะเป็นประโยชน์ในการตัดสินใจ การทดสอบสมมติฐาน และการวิเคราะห์อื่นๆ อีก