การวิเคราะห์ข้อสอบหลังสอบ
ประโยชน์ของการวิเคราะห์หลังสอบ
- ช่วยพัฒนาการเรียนการสอน เช่น ข้อสอบที่นักเรียนส่วนใหญ่ตอบได้ การสอนอาจไม่ต้องเน้นมาก ตรงกันข้ามถ้าส่วนใหญ่ตอบได้ไม่ดี การสอนในปีต่อไปควรเน้นมากขึ้น
- ใช้ในการปรับปรุงข้อสอบ เช่น บางทีพบว่าตอบผิดหมดเพราะมีข้อผิดพลาดในตัวข้อสอบเอง ทำให้เกิดความชำนาญในการสร้างข้อสอบให้ดียิ่งขึ้นทำให้ได้ข้อสอบคุณภาพดีเก็บไว้ในธนาคารข้อสอบ
- ใช้พิจารณาช่วยการตัดสินใจในการตัดสินผลสอบ
การวิเคราะห์หลังสอบ มี 2 แบบ คือ
- การวิเคราะห์ข้อสอบรายข้อ
- การวิเคราะห์ข้อสอบทั้งฉบับ
การวิเคราะห์ข้อสอบรายข้อ (Item Analysis)
วัตถุประสงค์ : เพื่อดูคุณสมบัติของข้อสอบแต่ละข้อในด้านต่าง ๆ คือ
- ระดับความยาก (Level of difficulty หรือ P )
- อำนาจจำแนก (Power of discrimination หรือ r )
- ประสิทธิภาพของตัวเลือก - ตัวลวง
วิธีการ : แบ่งกลุ่มผู้สอบออกเป็น 3 กลุ่ม คือ
- กลุ่มเก่ง กลุ่มปานกลาง และกลุ่มอ่อน โดยเรียงตามลำดับคะแนนจากสูงสุดลงมาต่ำสุด
- กลุ่มเก่ง (ตัดขึ้นไปข้างบน ที่ร้อยละ 25-33 ส่วนใหญ่ program นิยมใช้ 27 แต่ถ้าโค้งแจกแจงไม่ปกติ มักใช้ 33 โดยนับจากคะแนนสูงสุดลงมา)
- กลุ่มอ่อน (ใช้จำนวนเดียวกับกลุ่มเก่ง แต่นับจากคะแนนต่ำสุดขึ้นไป)
ถ้าจำนวนผู้สอบมีน้อยมาก (น้อยกว่า 30 คน) อาจใช้การแบ่งเพียง 2 กลุ่ม และไม่ควรคิดด้วย Program เพราะจะเกิด error มาก ต้องคิดเอง
การวิเคราะห์ :
- ใช้โปรแกรมคอมพิวเตอร์
- คำนวณจากสูตร (ค่า r มักสูงกว่าที่ได้จากการใช้โปรแกรม)
-
ระดับความยาก (P) คิดจากร้อยละของจำนวนผู้ตอบข้อสอบข้อนั้นได้ถูกต้อง
P = H+ L / 2 N
P = ระดับความยาก
H = จำนวนคนในกลุ่มเก่งที่ตอบข้อสอบถูก
L = จำนวนคนในกลุ่มอ่อนที่ตอบข้อสอบถูก
N = จำนวนคนในกลุ่มเก่งหรืออ่อนซึ่งมีจำนวนเท่ากัน
ข้อสอบแต่ละข้อควรมีระดับความยาก 0.2 - 0.8
ข้อสอบที่ระดับความยาก < 0.2 หรือ > 0.8 ควรตัดทิ้ง
ข้อสอบที่มีระดับความยาก 0.5 จะมีอำนาจจำแนกสูงสุด
ข้อสอบที่จำเป็นต้องรู้ ควรมีระดับความยากที่ 0.6 -0.8
ข้อสอบที่ยากไปหรือง่ายไป มักไม่สามารถจำแนกคนเก่ง-อ่อนได้
- อำนาจจำแนก (r) หมายถึง คุณสมบัติของข้อสอบที่สามารถแยกนักศึกษาได้ว่าเก่งหรืออ่อน ข้อสอบที่มีอำนาจจำแนกดี คือ ข้อสอบที่นักศึกษาในกลุ่มเก่งตอบถูกมากกว่านักศึกษาในกลุ่มอ่อน
r = H - L/N
r = อำนาจจำแนก
H = จำนวนนักศึกษาในกลุ่มเก่งที่ตอบข้อสอบถูก
L = จำนวนนักศึกษาในกลุ่มอ่อนที่ตอบข้อสอบถูก
N = จำนวนนักศึกษาในกลุ่มเก่งหรืออ่อน ซึ่งมีเท่ากัน
ค่า r จะมีค่าระหว่าง + 1.00 ถึง -1.00
r = 0.40 ขึ้นไป ดีมาก
r = 0.30-0.39 ดี
r = 0.20-0.29 พอใช้ อาจต้องปรับปรุงบ้าง
r ต่ำกว่า 0.20 ควรตัดทิ้งหรือแก้ไข
-
ประสิทธิภาพของตัวเลือกและตัวลวง
ข้อสอบที่มีคุณภาพดี จะมีลักษณะของตัวเลือกและตัวลวงดังนี้ - ตัวเลือกที่ถูกต้อง คนในกลุ่มเก่งต้องเลือกมากกว่ากลุ่มอ่อน
- มีการกระจายของผู้เลือกคำตอบตามตัวลวงต่าง ๆ
- คนในกลุ่มอ่อนต้องเลือกตัวลวงมากกว่าคนในกลุ่มเก่ง (ค่า r ของตัวลวงจะติดลบ)
- ตัวลวงที่ไม่มีนักศึกษาเลือกเลย อาจเป็นเพราะตัวลวงนั้นง่ายหรือตื้นเกินไป
- ตัวเลือกที่ถูกต้องที่กลุ่มเก่งเลือกน้อยกว่ากลุ่มอ่อน อาจเป็นเพราะ คำถามหรือคำตอบไม่ชัดเจน หรือเป็นเพราะคนเก่งคิดมากเกินไป
ตัวอย่างที่ 1
PH = กลุ่มเก่ง PL = กลุ่มอ่อน P = ค่าความยาก r = อำนาจจำแนก
| ข้อสอบ | ตัวเลือก | PH | PL | P | r |
|---|---|---|---|---|---|
| 1 | A | 0.10 | 0.03 | 0.06 | 0.07 |
| B | 0.13 | 0.42 | 0.28 | - 0.29 | |
| C | 0.03 | 0.16 | 0.16 | - 0.13 | |
| D | 0.10 | 0.13 | 0.14 | - 0.03 | |
| *E | 0.64 | 0.26 | 0.44 | 0.39 |
*คำตอบที่ถูกต้อง
วิเคราะห์ : เป็นข้อสอบที่มีคุณภาพดี ถ้าดูข้อถูก E ค่า P = 0.44 แสดงว่าค่อนไปทางยาก ค่า r = 0.39 ดี แสดงว่าแยกคนเก่งกับคนอ่อนได้ แต่เมื่อดูตัวลวงแต่ละตัว จะเห็นว่า ตัวลวง A อาจต้องปรับปรุงแก้ไขเพราะ ลวงคนในกลุ่มเก่งมากกว่ากลุ่มอ่อน (PH มากกว่า PL) ส่วนตัวลวงข้อ B C D ใช้ได้
ตัวอย่างที่ 2
| ข้อสอบ | ตัวเลือก | PH | PL | P | r |
|---|---|---|---|---|---|
| 2 | A | 0.13 | 0.00 | 0.06 | 0.45 |
| B | 0.19 | 0.07 | 0.13 | 0.24 | |
| C | 0.00 | 0.00 | 0.00 | 0.00 | |
| D | 0.07 | 0.13 | 0.10 | - 0.14 | |
| *E | 0.58 | 0.80 | 0.69 | - 0.26 |
*คำตอบที่ถูกต้อง
วิเคราะห์ : ข้อสอบคุณภาพไม่ดีเพราะอำนาจจำแนกติดลบ คนในกลุ่มอ่อนตอบถูกมากกว่าคนในกลุ่มเก่ง ตัวลวง A และ B ลวงคนเก่งมากกว่าคนอ่อน ตัวลวง C ไม่มีประสิทธิภาพ ไม่มีคนเลือกตอบเลย
ตัวอย่างที่ 3
| ข้อสอบ | ตัวเลือก | PH | PL | P | r |
|---|---|---|---|---|---|
| 3 | A | 0.13 | 0.00 | 0.06 | 0.45 |
| B | 0.19 | 0.27 | 0.13 | -0.24 | |
| C | 0.00 | 0.00 | 0.00 | 0.00 | |
| D | 0.07 | 0.13 | 0.10 | - 0.14 | |
| *E | 0.08 | 0.01 | 0.09 | 0.15 |
*คำตอบที่ถูกต้อง
วิเคราะห์ : ข้อสอบคุณภาพไม่ดีเพราะยากเกินไป อำนาจจำแนกต่ำ ตัวลวง A ลวงคนเก่งมากกว่าคนอ่อน ตัวลวง C ไม่มีประสิทธิภาพ ไม่มีคนเลือกตอบเลย
ตัวอย่างที่ 4
| ข้อสอบ | ตัวเลือก | PH | PL | P | r |
|---|---|---|---|---|---|
| 4 | A | 0.13 | 0.00 | 0.06 | 0.45 |
| B | 0.19 | 0.07 | 0.13 | 0.24 | |
| C | 0.15 | 0.02 | 0.10 | 0.12 | |
| D | 0.07 | 0.13 | 0.10 | -0.14 | |
| *E | 0.58 | 0.80 | 0.89 | -0.06 |
*คำตอบที่ถูกต้อง
วิเคราะห์ : ข้อสอบคุณภาพไม่ดีเพราะง่ายเกินไป อำนาจจำแนกติดลบ คนในกลุ่มอ่อนตอบถูกมากกว่าคนในกลุ่มเก่ง ตัวลวง A B C ลวงคนเก่งมากกว่าคนอ่อน