ย้อนไปที่ ตอน              


การวิเคราะห์ข้อสอบหลังสอบ (ต่อ)

การวิเคราะห์ข้อสอบทั้งชุด( Analysis  of total  test)

  1. การวัดแนวโน้มเข้าสู่ส่วนกลางและการกระจายของคะแนน  (Central  tendency  and  Variability)             
              ข้อสอบที่มีคุณภาพดี จะมี คะแนนเป็นลักษณะโค้งแจกแจงปกติ ซึ่ง  Mean , Median , Mode  จะเป็นค่าเดียวกัน
  2. ระดับความยากเฉลี่ย (Test  difficulty) ของข้อสอบทั้งชุด ขึ้นกับวัตถุประสงค์ของการสอบ  โดยปกติควรมีค่าอยู่ประมาณ 50-60 % 
    ระดับความยากเฉลี่ย  =  Median ของความยากของข้อสอบทั้งชุดx100
  3. อำนาจจำแนกเฉลี่ย (Test  Discrimination) ของข้อสอบทั้งชุด ควรมีค่าตั้งแต่ 0.20  ขึ้นไป
  4. ความเที่ยง (Test  reliability or Reliability Coefficient) ก็คือ ถ้าเราเอาเด็กคนนึงมาสอบข้อสอบชุดเดียวกัน 10 ครั้ง การสอบแต่ละครั้งปกติจะได้คะแนนไม่เท่ากัน ถ้าเด็กสอบแต่ละครั้งได้คะแนนใกล้เคียงกัน แสดงว่าข้อสอบมีความเที่ยง  ตรงกันข้าม ถ้าแตกต่างกันมาก แสดงว่าข้อสอบนั้นไม่มีความเที่ยง

                  การหาค่าความเที่ยง นิยมใช้สูตรของ Kuder  Richardson ซึ่งมี 2 สูตรคือ KR20 และ  KR21 (โปรแกรมวิเคราะห์ข้อสอบจะคำนวณให้ แต่เราต้องแปลผลเอง)

                  ถ้าข้อสอบแต่ละข้อมีความยากง่ายไม่แตกต่างกันทั้ง 2 ค่า จะใกล้เคียงกัน แต่ปกติค่า KR21  มักต่ำกว่า KR20 เพราะข้อสอบแต่ละข้อมักมีความยากง่ายแตกต่างกัน

          ค่าความเชื่อถือได้ควรมีค่า KR 20 ตั้งแต่ 0.70 ขึ้นไป
          ข้อสอบที่ต้องการวัดประสิทธิภาพของแต่ละคน เช่น  การสอบ Comprehensive  ควรมีค่าความเชื่อถือได้ตั้งแต่ 0.90 ขึ้นไป

    • ปัจจัยที่มีผลต่อความเที่ยงของข้อสอบ
      • จำนวนข้อสอบมากจะทำให้ค่าสูงขึ้น ข้อสอบ MCQ ควรมีจำนวน 80 ข้อขึ้นไป
      • ข้อสอบที่มีความยากง่ายพอเหมาะ (P=50 ) จะให้ค่าความเที่ยงได้สูงกว่าข้อสอบที่ยากหรือง่ายเกินไป
      • ข้อสอบที่มีการกระจายความยากง่ายของข้อสอบน้อย  จะให้ค่าความเที่ยงสูงกว่าข้อสอบที่มีการกระจายความยากง่ายแตกต่างกันมาก
      • ถ้ากลุ่มผู้ที่ถูกทดสอบมีความสามารถแตกต่างกันมากจะทำให้มีการกระจายของคะแนนมาก ทำให้มีความเที่ยงสูง

    5. ความคลาดเคลื่อนมาตรฐานของการวัด (Standard  error of  measurement : SEM)  หมายถึงความคลาดเคลื่อนของคะแนนที่สอบได้จากความสามารถจริง  ซึ่งจะมีส่วนสัมพันธ์โดยตรงกับความเที่ยงของข้อสอบ 


    ตัวอย่าง :  นักศึกษา ก. สอบได้คะแนน 40 จาก 100 คะแนน  เมื่อวิเคราะห์คะแนนทั้งชุดที่สอบ  พบว่า  SEM = 4.85   ความเที่ยง =  0.75


    true   score    =  obtained score +/-  Z x SEM
      ค่า Z  ที่ระดับความเชื่อมั่น 95 % = 1.96

    คะแนนความสามารถจริงของนักศึกษา  ก.  จะอยู่ระหว่าง 40 +/- 1.96 x 4.85
    นั่นคือ ถ้าสอบใหม่โดยใช้ข้อสอบชุดเดิม นักศึกษา ก. อาจได้คะแนนระหว่าง 31-49

              ถ้าสมมุติว่า MPL มีค่าเท่ากับ 50 อาจารย์จะตอบได้อย่างมั่นใจว่า เด็กคนนี้สมควรตกแน่ๆ เพราะต่อให้สอบอีกสัก 100 ครั้ง ก็ทำไม่ถึง 50 คะแนนแน่ๆ ไม่ต้องให้คะแนนสงสาร

              เพราะฉะนั้นการคิด true score จะมีประโยชน์มาก เพราะจะช่วยให้การวัดและประเมินผลมีความยุติธรรม

              ในกรณีที่ ค่า SEM สูง และค่าความเที่ยงต่ำ แสดงว่าข้อสอบไม่ดี ถ้าเด็กได้คะแนนไม่ดี อาจารย์ต้องพิจารณาปรับปรุงคะแนนให้นิสิต

              ปกติค่า true score โปรแกรมวิเคราะห์ข้อสอบไม่ได้คำนวณให้  แต่อาจารย์ใช้ค่า SEM กับค่า reliability มาคำนวณได้

              ฉะนั้นค่า SEM  จะช่วยในการตัดสินใจให้นักศึกษาสอบได้หรือตก


    สาเหตุที่ข้อสอบมีคุณภาพไม่ดี

    1. มีความบกพร่องที่ตัวข้อสอบเอง  เช่น  คำถามไม่ชัดเจน หรือเฉลยผิด
    2. ออกข้อสอบไม่ตรงตามวัตถุประสงค์และเนื้อหาวิชาที่กำหนดไว้  (ไม่ทำ table of spec) เช่น ถามเรื่องที่ไม่สำคัญ  หรือตัวเลขที่ไม่จำเป็นต้องจำ
    3. มีความบกพร่องที่การเรียนการสอน ไม่เน้นเรื่องที่สำคัญและต้องรู้ แต่นำเรื่องนั้นออกมาสอบ

     


    สรุป

              อาจารย์ออกข้อสอบให้ดี ผลวิเคราะห์ข้อสอบจะดีเอง ก่อนที่จะออกข้อสอบ MCQ ก็ทำ Table of Specification (ตารางจำแนกเนื้อหาและพฤติกรรม) ไว้กำกับการออกข้อสอบเสียก่อนว่าจะออกเรื่องอะไร เรื่องอะไรสำคัญที่ต้องรู้  ออกเป็น recall เท่าไร ออกเป็น application เท่าไร เป็นต้น อย่าแบ่งข้อสอบตามจำนวนชั่วโมงที่สอน

              ลำบากก่อน  สบายทีหลัง ตอนตัดเกรดอาจารย์ก็จะสบายใจ.....  : )  : )