ความเข้าใจผิดเกี่ยวกับค่า SD


ข้อมูลแจกแจงแบบปกติ

ตัวอย่างชุดข้อมูลคะแนนของนักเรียน 9 คน: 95, 100, 105, 110, 115, 120, 125, 130, 135 นำข้อมูลนี้ไปสร้างกราฟกล่อง จะสังเกตได้ว่าชุดข้อมูลนั้นสมมาตร ซึ่งแสดงว่าสามารถแสดงได้ดีด้วยการแจกแจงแบบปกติ

 

ค่าเฉลี่ย

ต่อมาคำนวณค่าเฉลี่ย โดยนำตัวเลขทั้งหมดมาบวกกันแล้วหารด้วยจำนวนทั้งหมด

ค่าเฉลี่ย = (95 + 100 + 105 + 110 + 115 + 120 + 125 + 130 + 135) / 9 = 115

ค่า SD

คำนวณค่าเบี่ยงเบนมาตรฐาน (SD) ค่า SD บอกให้เราทราบว่าตัวเลขกระจายออกจากค่าเฉลี่ยอย่างไร สูตรสำหรับ SD นั้นซับซ้อนกว่าเล็กน้อย แต่โดยพื้นฐานแล้วจะเกี่ยวข้องกับการหาค่าเฉลี่ยของผลต่างกำลังสองจากค่าเฉลี่ย แล้วหาค่ารากที่สองของตัวเลขนั้น

ในกรณีนี้ SD จะอยู่ที่ประมาณ 12.7 ค่า SD ไม่จำเป็นต้องน้อยกว่า 1 เป็นค่าเท่าไรก็ได้ขึ้นอยู่กับข้อมูล แต่สิ่งที่สำคัญคือ การตีความความสัมพันธ์ระหว่างค่าเฉลี่ยกับ ค่า SD

คะแนนเฉลี่ย 115 บอกเราว่า โดยเฉลี่ยแล้ว นักเรียนทำคะแนนได้ 115 คะแนนในการทดสอบ ค่า SD 12.7 บอกเราเกี่ยวกับการกระจายของคะแนนการทดสอบ 

ความเข้าใจผิดเกี่ยวกับค่า SD

  • แต่เราบอกไม่ได้ว่าค่า SD ควรมีค่าเท่าไร หรือ 
  • ค่า SD สูงบอกอะไร  หรือ 
  • ค่า SD มากดีไหม หรือ 
  • ค่า SD ต้องไม่เกินเท่าไร หรือ 
  • ค่า SD มากกว่า 1 หมายความว่าอะไร หรือ
  • ค่า SD น้อยกว่า 1 หมายความว่าอะไร 
  • เพราะมันขึ้นกับชุดข้อมูล (ที่ต้องย้ำ เพราะมีข้อมูลในเว็บที่เขียนไว้ผิดๆ ว่า ค่า SD ต้องไม่เกิน 1)

กฎเชิงประจักษ์หรือกฎ 68-95-99.7 

สำหรับการแจกแจงปกติ 

  • ข้อมูลประมาณ 68% อยู่ในค่าเบี่ยงเบนมาตรฐานหนึ่งค่าของค่าเฉลี่ย 
  • ประมาณ 95% อยู่ในค่าเบี่ยงเบนมาตรฐาน 2 ค่า 
  • และประมาณ 99.7% อยู่ในค่าเบี่ยงเบนมาตรฐาน 3 ค่า 
  • กฎนี้เรียกว่ากฎเชิงประจักษ์หรือกฎ 68-95-99.7

คะแนนสอบประมาณ 68% อยู่ใน 1 SD ของค่าเฉลี่ย หรือ 68% ของคะแนนสอบจะมีค่าน้อยกว่าหรือมากกว่าค่าเฉลี่ยเป็นจำนวน 1 เท่าของค่า ​SD นั่นคือระหว่าง (115 - 12.7) และ (115 + 12.7) หรือระหว่างประมาณ 102.3 ถึง 127.7 

คะแนนสอบประมาณ 95% อยู่ใน 2 SD ของค่าเฉลี่ย หรือ 95% ของคะแนนสอบจะมีค่าน้อยกว่าหรือมากกว่าค่าเฉลี่ยเป็นจำนวน 2 เท่าของค่า ​SD นั่นคือระหว่าง (115 - 2*12.7) และ (115 + 2*12.7) หรือระหว่างประมาณ 89.6 ถึง 140.4

ค่ามากกว่า 3 เท่าของค่า SD จากค่าเฉลี่ย คือ ผิดปกติ

ไม่มีกฎระบุค่า sd ที่ยอมรับได้ แต่เราสามารถบอกได้ว่า หากมีค่ามากกว่า 3 SD จากค่าเฉลี่ย จะถือว่าผิดปกติอย่างมากภายใต้สมมติฐานของค่าปกติ สิ่งเหล่านี้อาจเป็นค่าผิดปกติ เนื่องจากไม่ได้เป็นตัวแทนของข้อมูลส่วนใหญ่ 

 

 

 

 

หมายเลขบันทึก: 712890เขียนเมื่อ 22 พฤษภาคม 2023 21:35 น. ()แก้ไขเมื่อ 23 พฤษภาคม 2023 16:38 น. ()สัญญาอนุญาต: สงวนสิทธิ์ทุกประการจำนวนที่อ่านจำนวนที่อ่าน:


ความเห็น (1)

May I ask what this “การแจกแจงแบบปกติ” means?

If it is from English “normal distribution” then we ought to stress that “normal” here is “normal” under Central Limit Theorem’s definition (‘this’ sample data is bell-shaped, peaking at ‘average’/mean) with implication that it is of the same character as of the ‘whole population’.

In simple words “CLT” says in some cases, you can take a small sample of data from a much larger population and this small sample can represent the larger population and so analysis on this small sample can be true for the larger population. If and only if the sample and the population data are [Gaussian] normally distributed. CLT is useful in connecting ‘statistics’ and ‘probabilities’.——
- Where English ‘normal’(ปกติ)  adj 1: conforming with or constituting a norm or standard or level or type or social norm; not abnormal; “serve wine at normal room temperature”; “normal diplomatic relations”; “normal working hours”; “normal word order”; “normal curiosity”; “the normal course of events” [ant: {abnormal}.

  • From Royal Institute Dictionary (Th-Th)ปกติ ปะกะติ, ปกกะติ ว. ธรรมดา, เป็นไปตามเคย, ไม่แปลกไปจากธรรมดา, ปรกติ ก็ว่า. ( ป.; ส. ปฺรกฺฤติ).
พบปัญหาการใช้งานกรุณาแจ้ง LINE ID @gotoknow
ClassStart
ระบบจัดการการเรียนการสอนผ่านอินเทอร์เน็ต
ทั้งเว็บทั้งแอปใช้งานฟรี
ClassStart Books
โครงการหนังสือจากคลาสสตาร์ท