กราฟอะไรนะที่สามารถแสดงค่าสถิติที่สำคัญได้ตั้ง 5 ตัวในกราฟเดียว
คุณสมบัติของกราฟกล่อง
- Box-and-whisker plot หรือที่เรียกว่า Box plot คือกราฟรูปกล่องที่แสดงตัวเลขทางสถิติที่สำคัญ 5 ตัว ได้แก่ ค่าต่ำสุด ควอร์ไทล์แรก (เปอร์เซ็นไทล์ที่ 25) ค่ามัธยฐาน (เปอร์เซ็นไทล์ที่ 50) ควอร์ไทล์ที่สาม (เปอร์เซ็นไทล์ที่ 75) ) และค่าสูงสุด ซึ่งช่วยให้เข้าใจการกระจายของข้อมูลได้อย่างรวดเร็ว
- ตัวกล่องสี่เหลี่ยม มีเส้นด้านล่างแทนควอไทล์แรก (Q1) และเส้นบนสุดแทนควอไทล์ที่สาม (Q3) ช่องว่างภายในกล่องเป็นช่วงระหว่างควอไทล์ (IQR) ซึ่งมีข้อมูลอยู่ตรงกลาง 50%
- เส้นภายในกล่องแสดงถึงค่ามัธยฐาน (Q2) ซึ่งเป็นค่ากลางของชุดข้อมูล
- เส้น "หนวดแมว" (whisker) คือเส้นที่ขยายจากกล่องไปยังค่าน้อยที่สุดและค่ามากที่สุด
- จุดที่อยู่เหนือหรือล่างหนวดแมวถือเป็นค่าผิดปกติ (Outliers) กราฟกล่องช่วยได้มากในการระบุค่าผิดปกติได้อย่างง่ายดาย
- ถ้าข้อมูลมีความสมมาตร (ค่ามัธยฐานอยู่ตรงกลางกล่อง) หรือเบ้ (ค่ามัธยฐานอยู่ใกล้ด้านใดด้านหนึ่งของกล่อง) ถ้าข้อมูลเบ้ไปทางซ้าย ค่ามัธยฐานเข้าใกล้ Q3 มากกว่า Q1 หรือ ค่ามัธยฐานอยู่ใกล้กับด้านบนของกล่องนั่นเอง แต่ถ้าเบ้ขวา (ค่ามัธยฐานอยู่ใกล้ด้านล่างของกล่อง) กราฟกล่องช่วยให้ภาพว่าชุดข้อมุลผ่าน assumption หรือข้อตกลงของการแจกแจงปกติหรือไม่ได้อย่างรวดเร็ว
- ช่วงระหว่างควอไทล์ (IQR - ช่วงระหว่าง Q1 และ Q3) เป็นตัววัดว่า "กึ่งกลาง" ของชุดข้อมูลอยู่ที่ใด จึงทำให้เข้าใจถึงความแปรปรวนหรือการกระจายตัวของข้อมูล ถ้ากล่องเตี้ย แสดงว่าจุดข้อมูลอยู่ใกล้กัน กล่องทรงสูงแสดงว่าจุดข้อมูลถูกกระจายออกไป
- กราฟกล่องเป็นวิธีที่มีประสิทธิภาพมากในการแสดงข้อมูลจำนวนมาก และทำงานได้ดีกับข้อมูลทุกประเภท หรือทุกมาตราวัด
ตัวอย่างกราฟกล่อง
สมมุติว่าเรามีชุดข้อมูลที่แสดงถึงคะแนนของนักเรียน 20 คนในการสอบคณิตศาสตร์:
72, 88, 90, 80, 85, 78, 93, 85, 86, 75, 89, 79, 87, 92, 76, 80, 89, 77, 84, 90
การสร้างกราฟกล่อง
- อันดับแรก เรียงลำดับข้อมูลจากน้อยไปมาก: 72, 75, 76, 77, 78, 79, 80, 80, 84, 85, 85, 86, 87, 88, 89, 89, 90, 90, 92, 93
- ระบุค่ามัธยฐาน (เลขกลาง) เนื่องจากเรามีตัวเลข 20 ตัว ค่ามัธยฐานจะเป็นค่าเฉลี่ยของตัวเลขตัวที่ 10 และ 11: (85 + 85) / 2 = 85
- ระบุควอไทล์แรก (Q1) ซึ่งเป็นค่ามัธยฐานของข้อมูลครึ่งแรก ในกรณีนี้ ค่าเฉลี่ยของหมายเลขที่ 5 และ 6: (78 + 79) / 2 = 78.5
- ระบุควอไทล์ที่สาม (Q3) ซึ่งเป็นค่ามัธยฐานของครึ่งหลังของข้อมูล ในกรณีนี้ ค่าเฉลี่ยของวันที่ 15 และ 16: (89 + 89) / 2 = 89
- จากนั้น "กล่อง" จะวาดจากQ1 ไปยัง Q3 โดยมีเส้นภายในกล่องแทนค่ามัธยฐาน
- "หนวดแมว" ของกราฟถูกวาดจากกล่องไปยังค่าต่ำสุดและสูงสุดของข้อมูล เว้นแต่จะมีค่าผิดปกติ
Excel สร้างกราฟกล่อง
การแปลผลหรืออ่านผลกราฟกล่อง
- กราฟกล่องแสดงการกระจายของคะแนนการสอบ
- ค่ามัธยฐาน (85) หมายถึงคะแนนกลางของนักเรียน
- กล่องครอบคลุมตั้งแต่ Q1 (78.5) ถึง Q3 (89) แสดงว่าคะแนนกลาง 50% อยู่ในช่วงนี้
- หนวดขยายไปยังคะแนนต่ำสุด (72) และคะแนนสูงสุด (93)
- หากมีคะแนนต่ำกว่า 72 หรือสูงกว่า 93 มาก จะถือว่าคะแนนผิดปกติและมักทำเครื่องหมายด้วยสัญลักษณ์พิเศษ
- ในกรณีนี้ข้อมูลเบ้ไปทางซ้าย ค่ามัธยฐานเข้าใกล้ Q3 มากกว่า Q1 หรือ ค่ามัธยฐานอยู่ใกล้กับด้านบนของกล่องนั่นเอง