วิธีทำกราฟกล่อง (Box-and-whisker plot) และวิธีอ่าน


กราฟอะไรนะที่สามารถแสดงค่าสถิติที่สำคัญได้ตั้ง 5 ตัวในกราฟเดียว

 

คุณสมบัติของกราฟกล่อง

  • Box-and-whisker plot หรือที่เรียกว่า Box plot คือกราฟรูปกล่องที่แสดงตัวเลขทางสถิติที่สำคัญ 5 ตัว ได้แก่ ค่าต่ำสุด ควอร์ไทล์แรก (เปอร์เซ็นไทล์ที่ 25) ค่ามัธยฐาน (เปอร์เซ็นไทล์ที่ 50) ควอร์ไทล์ที่สาม (เปอร์เซ็นไทล์ที่ 75) ) และค่าสูงสุด ซึ่งช่วยให้เข้าใจการกระจายของข้อมูลได้อย่างรวดเร็ว
  • ตัวกล่องสี่เหลี่ยม มีเส้นด้านล่างแทนควอไทล์แรก (Q1) และเส้นบนสุดแทนควอไทล์ที่สาม (Q3) ช่องว่างภายในกล่องเป็นช่วงระหว่างควอไทล์ (IQR) ซึ่งมีข้อมูลอยู่ตรงกลาง 50%
  • เส้นภายในกล่องแสดงถึงค่ามัธยฐาน (Q2) ซึ่งเป็นค่ากลางของชุดข้อมูล
  • เส้น "หนวดแมว" (whisker) คือเส้นที่ขยายจากกล่องไปยังค่าน้อยที่สุดและค่ามากที่สุด 
  • จุดที่อยู่เหนือหรือล่างหนวดแมวถือเป็นค่าผิดปกติ (Outliers) กราฟกล่องช่วยได้มากในการระบุค่าผิดปกติได้อย่างง่ายดาย
  • ถ้าข้อมูลมีความสมมาตร (ค่ามัธยฐานอยู่ตรงกลางกล่อง) หรือเบ้ (ค่ามัธยฐานอยู่ใกล้ด้านใดด้านหนึ่งของกล่อง) ถ้าข้อมูลเบ้ไปทางซ้าย ค่ามัธยฐานเข้าใกล้ Q3 มากกว่า ​Q1 หรือ ค่ามัธยฐานอยู่ใกล้กับด้านบนของกล่องนั่นเอง แต่ถ้าเบ้ขวา (ค่ามัธยฐานอยู่ใกล้ด้านล่างของกล่อง)  กราฟกล่องช่วยให้ภาพว่าชุดข้อมุลผ่าน assumption หรือข้อตกลงของการแจกแจงปกติหรือไม่ได้อย่างรวดเร็ว
  • ช่วงระหว่างควอไทล์ (IQR - ช่วงระหว่าง Q1 และ Q3) เป็นตัววัดว่า "กึ่งกลาง" ของชุดข้อมูลอยู่ที่ใด จึงทำให้เข้าใจถึงความแปรปรวนหรือการกระจายตัวของข้อมูล ถ้ากล่องเตี้ย แสดงว่าจุดข้อมูลอยู่ใกล้กัน กล่องทรงสูงแสดงว่าจุดข้อมูลถูกกระจายออกไป
  • กราฟกล่องเป็นวิธีที่มีประสิทธิภาพมากในการแสดงข้อมูลจำนวนมาก และทำงานได้ดีกับข้อมูลทุกประเภท หรือทุกมาตราวัด

ตัวอย่างกราฟกล่อง

สมมุติว่าเรามีชุดข้อมูลที่แสดงถึงคะแนนของนักเรียน 20 คนในการสอบคณิตศาสตร์:

72, 88, 90, 80, 85, 78, 93, 85, 86, 75, 89, 79, 87, 92, 76, 80, 89, 77, 84, 90

 

การสร้างกราฟกล่อง

    - อันดับแรก เรียงลำดับข้อมูลจากน้อยไปมาก: 72, 75, 76, 77, 78, 79, 80, 80, 84, 85, 85, 86, 87, 88, 89, 89, 90, 90, 92, 93

    - ระบุค่ามัธยฐาน (เลขกลาง) เนื่องจากเรามีตัวเลข 20 ตัว ค่ามัธยฐานจะเป็นค่าเฉลี่ยของตัวเลขตัวที่ 10 และ 11: (85 + 85) / 2 = 85

    - ระบุควอไทล์แรก (Q1) ซึ่งเป็นค่ามัธยฐานของข้อมูลครึ่งแรก ในกรณีนี้ ค่าเฉลี่ยของหมายเลขที่ 5 และ 6: (78 + 79) / 2 = 78.5

    - ระบุควอไทล์ที่สาม (Q3) ซึ่งเป็นค่ามัธยฐานของครึ่งหลังของข้อมูล ในกรณีนี้ ค่าเฉลี่ยของวันที่ 15 และ 16: (89 + 89) / 2 = 89

    - จากนั้น "กล่อง" จะวาดจากQ1  ไปยัง Q3 โดยมีเส้นภายในกล่องแทนค่ามัธยฐาน

    - "หนวดแมว" ของกราฟถูกวาดจากกล่องไปยังค่าต่ำสุดและสูงสุดของข้อมูล เว้นแต่จะมีค่าผิดปกติ

Excel สร้างกราฟกล่อง

การแปลผลหรืออ่านผลกราฟกล่อง

    - กราฟกล่องแสดงการกระจายของคะแนนการสอบ

    - ค่ามัธยฐาน (85) หมายถึงคะแนนกลางของนักเรียน

    - กล่องครอบคลุมตั้งแต่ Q1 (78.5) ถึง Q3 (89) แสดงว่าคะแนนกลาง 50% อยู่ในช่วงนี้

    - หนวดขยายไปยังคะแนนต่ำสุด (72) และคะแนนสูงสุด (93)

    - หากมีคะแนนต่ำกว่า 72 หรือสูงกว่า 93 มาก จะถือว่าคะแนนผิดปกติและมักทำเครื่องหมายด้วยสัญลักษณ์พิเศษ

    - ในกรณีนี้ข้อมูลเบ้ไปทางซ้าย ค่ามัธยฐานเข้าใกล้ Q3 มากกว่า ​Q1 หรือ ค่ามัธยฐานอยู่ใกล้กับด้านบนของกล่องนั่นเอง

 

 

หมายเลขบันทึก: 712814เขียนเมื่อ 18 พฤษภาคม 2023 18:32 น. ()แก้ไขเมื่อ 18 พฤษภาคม 2023 19:19 น. ()สัญญาอนุญาต: สงวนสิทธิ์ทุกประการจำนวนที่อ่านจำนวนที่อ่าน:


ความเห็น (0)

ไม่มีความเห็น

พบปัญหาการใช้งานกรุณาแจ้ง LINE ID @gotoknow
ClassStart
ระบบจัดการการเรียนการสอนผ่านอินเทอร์เน็ต
ทั้งเว็บทั้งแอปใช้งานฟรี
ClassStart Books
โครงการหนังสือจากคลาสสตาร์ท