ค่าพิสัยระหว่างควอไทล์ (IQR) 

IQR หรือพิสัยระหว่างควอไทล์เป็นการวัดทางสถิติของการกระจายของข้อมูล เป็นความแตกต่างระหว่างควอไทล์บน (Q3) และควอไทล์ล่าง (Q1) และครอบคลุม 50% ตรงกลางของข้อมูล

นักวิจัยใช้ IQR เพื่อตรวจจับค่าผิดปกติเนื่องจากเป็นวิธีการวัดการกระจายที่เชื่อถือได้ IQR ดูที่การกระจายของข้อมูล 50% ตรงกลาง เนื่องจากพิจารณาจากค่ากลาง 50% เท่านั้น จึงทนทานต่ออิทธิพลของค่าที่สูงเกินไป ทำให้เป็นเครื่องมือที่มีประโยชน์มากในการตรวจจับค่าผิดปกติ

ค่าผิดปกติมักถูกกำหนดให้เป็นค่าสังเกตที่ต่ำกว่า Q1 − 1.5 IQR หรือสูงกว่า Q3 + 1.5 IQR ค่าเหล่านี้เป็นค่าที่ห่างจากข้อมูลส่วนที่เหลือพอสมควร 

ตัวอย่าง

สมมุติเรามีชุดข้อมูลคะแนนสอบดังนี้

75, 80, 85, 88, 89, 90, 90, 91, 92, 95, 96, 98, 100, 105, 110, 120, 130, 150.

ก่อนอื่นเราต้องคำนวณควอไทล์:

1. Q1 (ควอไทล์แรก) คือค่ามัธยฐานของครึ่งแรกของข้อมูล นี่คือ 88.5

2. Q3 (ควอไทล์ที่สาม) คือค่ามัธยฐานของครึ่งหลังของข้อมูล นี่คือ 105

ต่อไปคำนวณค่าพิสัยระหว่างควอไทล์ (IQR) ซึ่งก็คือ Q3 - Q1 = 105 - 88.5 = 16.5

เราใช้ IQR เพื่อกำหนด "ขอบเขต" สำหรับสิ่งที่ถือว่าเป็นค่าผิดปกติ:

1. เขตล่าง: Q1 - 1.5*IQR = 88.5 - 1.5*16.5 = 63

2. เขตบน: Q3 + 1.5*IQR = 105 + 1.5*16.5 = 130.5

จุดข้อมูลใด ๆ ที่อยู่นอกขอบเขตเหล่านี้ถือเป็นค่าผิดปกติ ดังนั้นในชุดข้อมูลนี้ ค่า "150" จึงเป็นค่าผิดปกติ เนื่องจากมีค่ามากกว่าขอบเขตบนของ 130.5 จุดข้อมูลอื่นๆ ทั้งหมดอยู่ในช่วงและไม่ถือว่าเป็นค่าผิดปกติ

ค่าผิดปกติไม่จำเป็นต้องเป็นข้อมูลที่ "ไม่ดี" หรือ "ผิด" แต่เป็นค่าที่มากเกินไปหรือน้อยเกินไปเทียบกับกลุ่มข้อมูลส่วนใหญ่