สมมติว่าเรามีโหลขนาดใหญ่ที่มีคุกกี้หลายขนาด คุกกี้ส่วนใหญ่มีขนาดกลาง บางอันก็เล็กกว่าหรือใหญ่กว่าเล็กน้อย และมีเพียงไม่กี่อันที่เล็กหรือใหญ่จริงๆ
การแจกแจงแบบปกติก็เหมือนคุกกี้ขวดนี้ เป็นวิธีการอธิบายว่าสิ่งต่างๆ เช่น ขนาดคุกกี้กระจายออกไปอย่างไร
ด้วยการแจกแจงแบบปกติ สิ่งต่างๆ (หรือคุกกี้) ส่วนใหญ่มีค่าใกล้เคียงกับค่าเฉลี่ย และมีสิ่งต่างๆ น้อยลงเรื่อยๆ เมื่อเรายิ่งห่างจากค่าเฉลี่ยมากขึ้น
ดังนั้น เมื่อเราพูดว่าบางสิ่งมีการแจกแจงแบบปกติ หมายความว่าส่วนใหญ่คล้ายกัน และมีเพียงไม่กี่อย่างที่ต่างกันมาก เช่นเดียวกับโหลคุกกี้ของเรา
เรื่องของการแจกแจงแบบปกติ หรือที่เรียกว่าการแจกแจงแบบเส้นกราฟระฆังคว่ำ เป็นแนวคิดพื้นฐานทางสถิติอย่างหนึ่ง เป็นการแจกแจงความน่าจะเป็นแบบต่อเนื่อง ที่แสดงถึงพฤติกรรมของปรากฏการณ์ทางธรรมชาติมากมาย ตัวอย่างเช่น
ในประชากรจำนวนมาก ความสูงของคนมักจะเป็นไปตามการแจกแจงแบบปกติ ความสูงเฉลี่ยแสดงถึงความสูงเฉลี่ยของบุคคลในประชากร และส่วนเบี่ยงเบนมาตรฐานจะวัดการกระจายของความสูงรอบๆ ค่าเฉลี่ย เส้นโค้งรูประฆังแสดงให้เห็นว่าคนส่วนใหญ่มีส่วนสูงใกล้เคียงกับค่าเฉลี่ย โดยมีคนส่วนน้อยที่สูงหรือเตี้ยมาก
ในการทดสอบมาตรฐาน เช่น TOEFL หรือ IELTS การกระจายของคะแนนสอบมักจะเป็นไปตามการแจกแจงแบบปกติ คะแนนเฉลี่ยแสดงถึงประสิทธิภาพโดยเฉลี่ยของผู้สอบ และส่วนเบี่ยงเบนมาตรฐานจะวัดความแปรผันของคะแนน เส้นโค้งรูประฆังบ่งชี้ว่านักเรียนส่วนใหญ่ทำคะแนนได้ใกล้เคียงกับค่าเฉลี่ย โดยมีนักเรียนจำนวนน้อยที่ได้คะแนนสูงหรือต่ำมาก
ซึ่งหมายความว่าด้านซ้ายและด้านขวาของการแจกแจงเป็นภาพสะท้อนของกันและกัน ครึ่งซ้ายของเส้นโค้งเป็นภาพสะท้อนของครึ่งขวา จุดสูงสุดของเส้นโค้งสอดคล้องกับค่าเฉลี่ย ซึ่งเป็นค่าเฉลี่ยของจุดข้อมูลทั้งหมดในการแจกแจง ค่าเฉลี่ยแสดงถึงศูนย์กลางของการกระจายและเขียนแทนด้วยตัวอักษรกรีก μ (mu)
นอกจากค่าเฉลี่ยแล้ว การแจกแจงแบบปกติยังแสดงด้วยค่าเบี่ยงเบนมาตรฐาน ซึ่งเขียนแทนด้วยตัวอักษรกรีก σ (ซิกม่า) ส่วนเบี่ยงเบนมาตรฐานเป็นการวัการกระจายของข้อมูล ค่าเบี่ยงเบนมาตรฐานที่มากขึ้นบ่งชี้ว่าจุดข้อมูลกระจายออกไปมากขึ้น ในขณะที่ค่าเบี่ยงเบนมาตรฐานที่น้อยลงหมายความว่าจุดข้อมูลถูกจัดกลุ่มอย่างใกล้ชิดรอบๆ ค่าเฉลี่ย
1. ค่าเฉลี่ย มัธยฐาน และฐานนิยมเท่ากันในการแจกแจงแบบปกติ ตรงตำแหน่งแกนสมมาตร
2. ประมาณ 68% ของจุดข้อมูลอยู่ในค่าเบี่ยงเบนมาตรฐานหนึ่งค่าของค่าเฉลี่ย (μ ± σ)
3. ประมาณ 95% ของจุดข้อมูลอยู่ในค่าเบี่ยงเบนมาตรฐานสองค่าของค่าเฉลี่ย (μ ± 2σ)
4. ประมาณ 99.7% ของจุดข้อมูลอยู่ในค่าเบี่ยงเบนมาตรฐานสามค่าของค่าเฉลี่ย (μ ± 3σ)
5. พื้นที่ทั้งหมดใต้เส้นโค้งของการแจกแจงแบบปกติเท่ากับ 1 หมายความว่าความน่าจะเป็นของค่าที่เกิดขึ้นภายในช่วงของการกระจายคือ 100%
คุณสมบัตินี้เรียกว่ากฎเชิงประจักษ์หรือกฎ 68-95-99.7
การแจกแจงแบบปกติใช้กันอย่างแพร่หลายในสาขาต่างๆ เช่น สังคมศาสตร์ วิทยาศาสตร์ และวิศวกรรมศาสตร์ มีบทบาทสำคัญในการทดสอบสมมติฐาน โดยเราจะเปรียบเทียบข้อมูลตัวอย่างกับการแจกแจงแบบปกติเพื่ออนุมานเกี่ยวกับประชากรที่สุ่มตัวอย่างมา
ไม่มีความเห็น