จากตัวอย่างที่แล้วที่เราได้ดูการเปรียบเทียบ 2 ตัวแปร
แล้วพบว่าเพศชายร้อยละ 61.5 สนใจที่จะทำ R2R ขณะที่เพศหญิงเพียงร้อยละ
57.1 เท่านั้นที่สนใจทำ R2R ข้อมูลนี้ยังถือว่าเป็นจริงอยู่
เพราะเป็นข้อมูลที่ได้จากการวิเคราะห์ความถี่จริง
แต่ข้อสรุปต่อมาที่ว่า สรุปว่า
เพศชายสนใจทำ R2R มากกว่าเพศหญิง บทสรุปนี้แหละครับที่ไม่ถูกต้อง
เพราะสรุปได้เกินกว่าความเป็นจริง
เพราะอะไรครับเรามาดูคำเฉลยกัน
การบอกว่าเพศชายสนใจทำ R2R
มากกว่าเพศหญิงนั้นเป็นการสรุปจากสายตา
โดยเอาค่าร้อยละของเพศชายที่สนใจทำ R2R
มาเปรียบเทียบกับร้อยละของเพศหญิงที่สนใจทำ R2R แล้ว เพศชายมากกว่า
ก็เลยสรุปว่าเพศชายสนใจทำ R2R มากกว่า ตรงนี้ถือว่าเราได้ตกหลุมพรางของตัวเลขเข้าแล้ว
แม้ว่าภาพที่เราเห็นจะเป็นเช่นนั้นก็ตาม
ในทางสถิติ การเปรียบเทียบกลุ่มตัวอย่าง 2 กลุ่ม
ในเรื่องใดเรื่องหนึ่งนั้น
จะต้องมีการตั้งสมมติฐานว่ากลุ่มตัวอย่างทั้งสองกลุ่มมีค่าเฉลี่ยไม่ต่างกัน
แล้วหาทางพิสูจน์ว่าค่าเฉลี่ยของกลุ่มตัวอย่างทั้งสองกลุ่มไม่แตกต่างกันจริง
ถ้าพิสูจน์ได้ว่าค่า p value มีค่ามากกว่า 0.05
แสดงว่าเรายอมรับสมมติฐานว่าค่าเฉลี่ยของกลุ่มตัวอย่างทั้งสองกลุ่มนั้นไม่แตกต่างกัน
ก็เข้าใจได้ว่ามันเหมือนกันก็แล้วกัน ส่วนถ้าค่า p value น้อยกว่า
0.05 แสดงว่าเราไม่สามารถปฏิเสธได้ว่ามันเหมือนกัน
ภาษาเข้าใจยากอีกแล้ว
เอาเป็นว่ากลุ่มตัวอย่างทั้งสองกลุ่มมีค่าเฉลี่ยแตกต่างกัน
เรื่องนี้เอาเป็นว่าผมค่อยอธิบายให้ฟังอย่างละเอียดทีหลังก็แล้วกัน
ทีนี้ลักษณะข้อมูลของเราเป็นตัวอักษร
ภาษาสถิติเขาเรียกว่านามบัญญัติ (nominal scale)
ฟังแล้วก็เข้าใจยากอีก
เอาเป็นว่าข้อมูลที่เราเก็บเป็นตัวอักษร อย่างเช่น
เพศชาย เก็บเป็นตัว M แล้ว เพศหญิง เก็บเป็นตัว F
บางคนบอกว่าฉันเก็บเป็นตัวเลข ให้ 1 เท่ากับผู้ชาย แล้ว 2
เท่ากับผู้หญิง ฉันไม่ได้เก็บเป็นตัวอักษร เอ้า
เป็นตัวอักษรหรือเป็นตัวเลขก็ได้
แต่ถ้าเป็นตัวเลขก็ใช้เปรียบเทียบค่ากันไม่ได้ ในที่นี้
หมายถึง เก็บเป็น 1 กับ 2 ซึ่งเลข 2
ในที่นี้ก็ไม่ได้หมายความว่ามีค่ามากกว่า 1 อย่างนี้พอจะเข้าใจไหม
ข้อมูลลักษณะนี้ เวลาเปรียบเทียบกัน
เขาวิเคราะห์ด้วยสถิติแบบนอนพาราเมตริกครับ โดยใช้สถิติที่เรียกว่า
ไคว์สแคว์ (chi square)
อย่าลืมครับว่าเราสัญญากันแล้วว่าไม่ต้องไปดูวิธีคำนวณ
แค่นึกว่าเราจะใช้ไคว์สแคว์ ก็แค่กด Crosstab
แล้วติ๊กเลือกสถิติ ไคว์สแคว์ แล้วมันก็โผล่ออกมา
เราไปดูกัน
ในที่นี้
จะมีค่าตัวอื่นๆออกมาด้วย แต่ตัวแรกที่เราสนใจก็คือค่า
ปัวซองไคว์สแคว์
ได้ค่า 1.832 แต่ก็ยังแปรผลยากอีก เพราะ
ต้องเอาค่าที่ระดับนัยสำคัญมาเทียบ
เราข้ามไปดูค่าที่เราใช้กันดีกว่า นั่นคือค่า
asym sig 2 side หรือค่า p value
ที่เรารู้จักกันดี อย่าลืมนะครับว่า
ค่านี้จะใช้เทียบกับค่า 0.05
ถ้าค่า p value มากกว่า 0.05
แสดงว่าค่าเฉลี่ยของกลุ่มตัวอย่างที่สองเพศไม่ต่างกัน แต่ถ้าค่า p
value น้อยกว่า 0.05
แสดงว่าค่าเฉลี่ยของกลุ่มตัวอย่างทั้งสองเพศแตกต่างกัน
แล้วตัวเลขที่ออกประจำงวดนี้ ได้แก่ ….0.176 ไชโย ! มีค่ามากกว่า 0.05
ค่าเฉลี่ยของทั้งเพศชายและเพศหญิงไม่แตกต่างกันครับ
บอกแล้วไงว่า
ที่เราเห็นตั้งแต่ต้นมันเป็นเพียงภาพลวงตา
ของจริงต้องใช้สถิติช่วยครับถึงจะเห็นว่าต่างจริงหรือเปล่า
เมื่อเริ่มเข้าใจหลุมพรางหลุมแรกแล้ว ก็อย่าตกหลุมที่สองอีก
ไม่ใช่ว่าไคว์สแคว์จะใช้ได้ในทุกเรื่องครับ
มันมีข้อกำหนดในการใช้อยู่
เราไปดูกัน
- ข้อแรก บอกเอาไว้ว่า ใช้ในการวิเคราะห์ข้อมูลที่เป็น
นามบัญญัติ
ก็อย่างที่ได้อธิบายไว้แล้วข้างต้นครับ
- ข้อสอง กลุ่มตัวอย่างทั้งสองกลุ่มที่นำมาเปรียบเทียบกัน
ต้องไม่ขึ้นแก่กัน เป็นอิสระต่อกัน เอ !
แล้วจะอธิบายยังไงดีนะ ในที่นี้กลุ่มตัวอย่างที่เป็นเพศชาย
กับที่เป็นเพศหญิง เป็นคนละกลุ่ม ไม่ขึ้นแก่กัน
ฟังดูอาจจะยังไม่เข้าใจอีก เราลองไปดูกลุ่มตัวอย่างแบบที่ไม่เป็นอิสระหรือบางครั้งเขาเรียกว่ากลุ่มตัวอย่างมีความสัมพันธ์กันดีกว่า
อย่างเช่น การเปรียบเทียบนักเรียนห้องเดียวกัน ทำข้อสอบ Pretest
ก่อนเรียน แล้วก็ Posttest หลังเรียน แล้วเอาคะแนนมาเทียบกัน
อย่างนี้ถือว่าเป็นกลุ่มตัวอย่างที่มีความสัมพันธ์กัน ไม่เป็นอิสระกัน
เพราะนักเรียนคนที่ 1 ที่ทำ Pretest กับ Posttest เป็นคนเดียวกัน
ก็เลยไม่เป็นอิสระต่อกัน พอจะเห็นภาพลางๆบ้างไหม
- ข้อสาม ค่าไคว์สแคว์ใช้ได้ในกรณีที่ไม่มีข้อมูลในช่องใดช่องหนึ่งมีค่าคาดหวังน้อยกว่า
5 ลงมาไอ้ค่าคาดหวังนี้เป็นค่าคำนวณครับ
เราสัญญากันแล้วว่าจะไม่คำนวณ ปกติตรงท้ายตารางของไคว์สแคว์ (ดูหมายเหตุ b ในตาราง)
จะบอกไว้ว่าในตารางมีอยู่กี่ช่องที่มีค่าคาดหวังน้อยกว่า 5
ซึ่งถ้าเจอตรงนี้เมื่อไหร่ ก็ให้รู้ไว้เลยครับว่าใช้ค่า ไคว์สแคว์ตรงๆ ไม่ได้ ต้องหนีไปใช้ค่า
Adjust chi square หรือ Yates’ chi square
ซึ่งรู้สึกว่า บน SPSS จะไม่มีค่าตัวนี้ แต่คำนวนบน web ได้ครับ
ลองไปใช้ที่นี่ครับ http://www.quantpsy.org/chisq/chisq.htm จะมีทั้งค่า ไคว์สแคว์ และ Yates’ chi square
สามารถคำนวณได้เลยครับ ในกรณีนี้บางคนบอกว่าถ้าตัวอย่างตรวจไม่มากสามารถใช้ค่า Fisher’s Exact
test ได้ครับ ถ้าใช้ค่านี้ ก็อยู่ที่บรรทัดที่ 4
ในตารางเดียวกันครับ โดยให้ดูที่ Exact Sig 2 side เป็นค่า p value
แล้วเปรียบเทียบเหมือนกันครับ
(ที่เรากำลังคุยกันอยู่นี้ผมยกตัวอย่างสำหรับข้อมูลที่อยู่ในตาราง 2 x
2 นะครับ หากตารางใหญ่กว่านี้ ค่อยว่ากันตอนหน้าครับ
เพราะฉะนั้น
เมื่อไหร่ที่เจอว่าเป็นการเปรียบเทียบตัวอย่างสองกลุ่มล่ะก็
อย่าดูแต่ตัวเลขที่แสดงครับ เพราะสิ่งที่เห็นอาจเป็นภาพลวงตา
ให้ถามไปเลย ว่า ค่า p value ล่ะมีไหม ถ้ามีควักออกมาเลย
อย่าซุกครับ
จบไปแล้ว 1 เรื่องว่าด้วยเรื่องของ ไคว์สแคว์
พอจะเข้าใจการใช้บ้างไหมครับ ?
ดูการใช้ไคว์สแคว์ ภาคสมบูรณ์
ที่นี่ครับ