ครั้งที่ 12 "การตรวจสอบคุณภาพของเครื่องมือ" : แบบทดสอบ


ระเบียบวิธีวิจัยขั้นสูง

      ทำได้โดยการตรวจสอบ  ค่าความยากง่าย  ค่าอำนาจจำแนก  ค่าความเที่ยง  และค่าความเชื่อมั่น

ซึ่งเราต้องดูก่อนนะคะว่า  แบบทดสอบของเราเป็นแบบอิงกลุ่ม หรือ แบบอิงเกณฑ์

ในที่นี้จะขอกล่าวถึง การตรวจสอบคุณภาพแบบของทดสอบแบบอิงกลุ่มนะคะ

(1)  ความยากง่ายแบบของทดสอบแบบอิงกลุ่ม (Difficulty : p)

      คือ สัดส่วนของคนที่ทำข้อสอบข้อนั้นถูก เทียบกับ จำนวนคนที่เข้าสอบทั้งหมด

       :    ค่าความยากง่าย (p)  จะมีค่าตั้งแต่ 0.00 ถึง 1.00

       :    "ตัวเลือกที่ถูกต้อง" ควรมีค่า  p  ตั้งแต่  0.20 -0.80 "ตัวลวง" ควรมีค่า  p  ตั้งแต่  0.05 -0.50

       :    "ตัวเลือกที่ถูกต้อง” หากมีค่า p สูง แสดงว่าข้อสอบข้อนั้นง่าย (ข้อสอบง่ายเกินไปเมื่อ  p > 0.80)

                                     หากมีค่า p ต่ำ  แสดงว่าข้อสอบข้อนั้นยาก (ข้อสอบยากเกินไปเมื่อ  p < 0.20)

 ตัวอย่าง 

                  

                    ข้อมูลจากตาราง  เป็นดังนี้   :  มีข้อสอบอยู่ทั้งหมด 5 ข้อ

                                                        :  มีผู้เข้าสอบ จำนวน  20 คน

                                                        :  ตัวเลือกที่มีสีแดง คือ ตัวเลือกที่ถูกต้อง

การคำนวณค่าความยากง่าย         คิดจากสูตร                

                                                P    แทน    ค่าความยากง่าย (สัดส่วนของคนที่ตอบข้อนั้นถูก)

                                                R    แทน    จำนวนผู้ที่ตอบถูก

                                                N    แทน    จำนวนผู้ที่เข้าสอบทั้งหมด

ข้อ  1. ตัวเลือกที่ถูกต้อง คือ ข้อ ก.  มีคนเลือกตอบจำนวน 14 คน      

ข้อ  3. ตัวเลือกที่ถูกต้อง คือ ข้อ ข.  มีคนเลือกตอบจำนวน 10 คน      

ข้อ  5. ตัวเลือกที่ถูกต้อง คือ ข้อ ง.  มีคนเลือกตอบจำนวน 2 คน       

การพิจารณา  ข้อ 1 , 3 , 5  ค่าความยากง่ายใช้ได้  เนื่องจากอยู่ระหว่าง  0.2 – 0.8

                                  แต่   ข้อ  1.  ค่อนข้างง่าย  เพราะค่า p สูง  (0.7)  มีคนเลือกตอบมาก (14 คน)

                                         ข้อ  5.  ค่อนข้างยาก  เพราะค่า p ต่ำ  (0.1)  มีคนเลือกตอบน้อย (2 คน)

(2)  อำนาจจำแนกของแบบทดสอบแบบอิงกลุ่ม (Discrimination : r)

       คือ สัดส่วนของผลต่างระหว่างจำนวนผู้ตอบข้อสอบข้อนั้นถูกในกลุ่มสูง (เก่ง) กับกลุ่มต่ำ (อ่อน) ต่อ จำนวนผู้สอบในกลุ่มเก่งหรือกลุ่มอ่อน

      (ทำให้เราทราบว่าข้อสอบข้อนั้น  จะแยกคนเก่งออกจากคนอ่อนได้เพียงใด)

       :    ค่าอำนาจจำแนก (r)  จะมีค่าตั้งแต่ -1.00 ถึง 1.00 (-1.00 ≤ r ≤ 1.00)

       :    ค่า r สูง แสดงว่า ข้อสอบมีค่าอำนาจจำแนกสูง

       :    ค่า r ต่ำ แสดงว่า ข้อสอบมีค่าอำนาจจำแนกต่ำ                                             

       :    ค่า r เป็นศูนย์ (0)  แสดงว่า ข้อสอบไม่มีอำนาจจำแนก                                            

       :    "ตัวเลือกที่ถูกต้อง"  ควรมีค่า r ≥ 0.20  ขึ้นไป

       :    "ตัวลวง"  ควรมีค่า r > 0  ขึ้นไป

สูตรการค่าอำนาจจำแนก

ตัวเลือกที่เป็น “ตัวถูก”     ใช้สูตร          หรือ        

 

ตัวเลือกที่เป็น “ตัวลวง”   ใช้สูตร          หรือ         

                    r     คือ  ค่าอำนาจจำแนก

                   H      คือ  จำนวนคนที่ตอบถูกในกลุ่มเก่ง

                   H      คือ  จำนวนคนที่ตอบถูกในกลุ่มอ่อน

                   nH    คือ  จำนวนคนทั้งหมดในกลุ่มเก่ง

                   nL    คือ  จำนวนคนทั้งหมดในกลุ่มอ่อน  ***    ข้อสังเกต  nH = nL  เสมอ

ตอนนี้หลายคนกำลังสงสัยใช่ไหมคะว่า  กลุ่มเก่ง กับ กลุ่มอ่อน จะรู้ได้อย่างไร  ... มีวิธีดำเนินการดังนี้ค่ะ

1)  เอาข้อสอบของผู้เรียนทุกคน  มาเรียงคะแนนจากสูงไปหาต่ำ

2)  แบ่งครึ่งข้อสอบออกเป็นสองส่วนเท่าๆ กัน ...เช่น ผู้เรียน จำนวน 40 คน ก็แบ่งเป็น ชุด A จำนวน 20 คน และ ชุด B จำนวน 20 คน

    ชุดที่ได้คะแนนมาก (ให้เป็นกลุ่มเก่ง : High group,H)  และ ชุดที่ได้คะแนนน้อย (ให้เป็นกลุ่มอ่อน : Low group,L)

* หรืออาจใช้เทคนิค 25% , 27% , 50% ก็ได้ (โดยยึดหลักว่า  จำนวนคนที่เข้าสอบน้อยให้ใช้เปอร์เซ็นต์สูงมาก หากจำนวนคนที่เข้าสอบมากให้ใช้เปอร์เซ็นต์ต่ำ ... แต่ ไม่ควรต่ำกว่า 25%)

ขอยกตัวอย่าง  การเลือกใช้เทคนิค 25% นะคะ (จากที่มีผู้เข้าสอบทั้งหมด 40 คน)

:  25% ของ 40 คน คือ ...10 คน... จากนั้นก็ทำตามขั้นตอน ดังนี้

1. เรียงคะแนนจากสูงไปหาต่ำ (คือ ลำดับที่ 40 ไปหาลำดับที่ 1)

2. นำคะแนนลำดับที่ 40 - 31 มาเป็นกลุ่มเก่ง (H)  และ นำคะแนนลำดับที่ 1 - 10 มาเป็นกลุ่มอ่อน (L) 

3. จากนั้นก็ทำการคำนวณตามสูตรเลยค่ะ                     

(3)  ความเที่ยงตรงของแบบทดสอบแบบอิงกลุ่ม (Validity)

       คือ ประสิทธิภาพของแบบทดสอบที่สามารถวัดลักษณะ (Trait) ที่ต้องการจะวัด  มี 4 ชนิด คือ

       :    ความเที่ยงตรงเชิงเนื้อหา (Content validity)               

       :    ความเที่ยงตรงเชิงโครงสร้าง (Construct validity) 

       :    ความเที่ยงตรงเชิงพยากรณ์ (Predictive validity)

       :    ความเที่ยงตรงเชิงตามสภาพ (Concurrent validity)

       การหาค่าความตรงเชิงเนื้อหา  ทำได้โดยให้ผู้เชี่ยวชาญเป็นผู้พิจารณา ค่า IOC (Item-Objective Congrence) ** ผู้เชี่ยวชาญตั้งแต่ 3 ท่านขึ้นไป

       สูตร  การหาค่าความตรง          

               

               IOC  แทน  ค่าดัชนีความสอดคล้อง                                

               ∑R  แทน  ผลรวมคะแนนของผู้เชี่ยวชาญทั้งหมด

                N  แทน  จำนวนผู้เชี่ยวชาญทั้งหมด

                คะแนน  -1  หมายถึง  คำถามไม่สอดคล้องกับวัตถุประสงค์

                คะแนน   0  หมายถึง  ไม่แน่ใจว่าคำถามสอดคล้องกับวัตถุประสงค์หรือไม่

                คะแนน  +1  หมายถึง  คำถามสอดคล้องกับวัตถุประสงค์

การแปลผล คะแนน        :  ค่า IOC  ≥  0.50  หมายความว่า คำถามข้อนั้นวัดตรงกับวัตถุประสงค์

                                 :  ค่า IOC  <  0.50  หมายความว่า คำถามข้อนั้นวัดไม่ตรงกับวัตถุประสงค์

แสดงตัวอย่างการคำนวนค่า IOC ดังนี้

ข้อ 1. ผู้เชี่ยวชาญคนที่ 1  ให้คะแนน  0

        ผู้เชี่ยวชาญคนที่ 2  ให้คะแนน +1

        ผู้เชี่ยวชาญคนที่ 3  ให้คะแนน +1

        ผู้เชี่ยวชาญคนที่ 4  ให้คะแนน +1

        ผู้เชี่ยวชาญคนที่ 5  ให้คะแนน 0         

        ...ผลรวมคะแนน  ∑R = 3 จากผู้เชี่ยวชาญทั้งหมด N = 5 คน 

       ...ดังนั้น  แทนค่าสูตร ได้ดังนี้  

แปลผลคะแนนได้ดังนี้  :  ค่า IOC (0.6) ≥  0.50  หมายความว่า คำถามข้อนี้วัดตรงกับวัตถุประสงค์

(4)  ความเชื่อมั่นของแบบทดสอบแบบอิงกลุ่ม (Reliability)               

       คือ ค่าความคงที่แน่นอน คงเส้นคงวา น่าเชื่อถือ มีความสอดคล้องภายในแบบทดสอบ   

โดยสามารถคำนวณโดยเลือกใช้สูตรต่างๆ ได้ดังนี้                

                                                      

                                                          

                                                             

แล้วจะเลือกใช้สูตรไหน...อย่างไร...?

คำตอบก็ คือ ...

A :  สูตรสัมประสิทธิ์แอลฟา (Alpha coefficient) ของ Cronbach คือ สูตร 1

      ใช้เมื่อ   คะแนนที่ได้จากเครื่องมือวิจัยมีค่ามากกว่า 2 ระดับ (ไม่เป็นเพียงแค่ 1 คะแนน กับ 0 คะแนน)  โดยคะแนนที่ได้อาจมีหลายระดับ เช่น 5 , 4 , 3 , 2 , 1 (ซึ่งอาจได้จากคะแนนมาตราส่วนประมาณค่า หรือ เป็นคะแนนจากข้อสอบอัตนัย เป็นต้น)

       ##  ใช้ได้กับข้อสอบปรนัย และ ข้อสอบอัตนัย

       ##  ค่า α (แอลฟา) ตั้งแต่ .70 ขึ้นไป  ถือว่ามีความเที่ยงใช้ได้

B :  สูตรของ ครูเดอร์ - ริชาร์ดสัน (Kuder - Richardson formulas) คือ สูตร 2 และ 3 

       ##  ใช้ได้กับข้อสอบปรนัยเท่านั้น

       ##  คะแนนที่ได้จากเครื่องมือวิจัยมีค่า 2 ระดับ คือ 1 กับ 0 (...เช่น ตอบถูก ได้ 1 คะแนน , ตอบผิด ได้ 0 คะแนน)

* KR-20  : ใช้กับเครื่องมือที่ ข้อสอบแต่ละข้อ มีระดับความยากต่างกัน

* KR-21  : ใช้กับเครื่องมือที่ ข้อสอบแต่ละข้อ มีระดับความยากพอๆ กัน

       ##  ทั้งนี้ควรเลือกใช้ KR-20 เพราะความเป็นจริง ข้อสอบแต่ละข้อมีค่าความยากง่ายไม่เท่ากัน

 

หมายเลขบันทึก: 402923เขียนเมื่อ 16 ตุลาคม 2010 13:35 น. ()แก้ไขเมื่อ 23 มิถุนายน 2012 03:54 น. ()สัญญาอนุญาต: ครีเอทีฟคอมมอนส์แบบ แสดงที่มา-ไม่ใช้เพื่อการค้า-อนุญาตแบบเดียวกันจำนวนที่อ่านจำนวนที่อ่าน:


ความเห็น (1)

การประเมินผลตามแนวคิดอิงกลุ่ม เป็นการเปรียบเทียบความสามารถของผู้เรียนในกลุ่ม

ลักษณะที่สาคัญต้องคำนึงถึง ความยาก และอำนาจจำแนก โดยเลือกถึงความพอเหมาะ

และสามารถในการจำแนก

พบปัญหาการใช้งานกรุณาแจ้ง LINE ID @gotoknow
ClassStart
ระบบจัดการการเรียนการสอนผ่านอินเทอร์เน็ต
ทั้งเว็บทั้งแอปใช้งานฟรี
ClassStart Books
โครงการหนังสือจากคลาสสตาร์ท