การทำงานวิจัยหลายๆ อย่างไม่มีข้อจำกัด อยากจะเก็บตัวอย่างตรวจมาวิเคราะห์เท่าไหร่ก็ได้ แต่การทำงานวิจัยอีกหลายอย่างก็มีข้อจำกัด

     ก่อนที่จะไปถึงขั้นตอนการเลือกว่าจะใช้สถิติตัวไหน ยังต้องมีข้อตกลงกันก่อน อย่างน้อยก็เพื่อให้เข้าใจตรงกัน เหมือนกับคำถามว่าถ้าอยากพาเด็กไปสวนสนุกสักแห่งคุณเลือกพาไปที่ไหน ก็มีสวนสนุกข้างบ้าน กับ พาไปดีมเวิลด์ จะเห็นว่าเป็นเครื่องเล่นเหมือนกัน เล่นได้เหมือนกัน สนุกเหมือนกัน ต้องจ่ายตังค์เหมือนกัน แต่ความมากมาย ความน่าเชื่อถือในเรื่องความปลอดภัยต่างกัน เรื่องของสถิติที่เราจะพูดถึงก็เหมือนกัน มันแบ่งเป็นสองกลุ่มครับ เรียกกันว่า พาราเมตริก (parametric statistics) กับ นอนพาราเมตริก (non-parametric statistics) ใช้ในการวิเคราะห์เหมือนกัน บอกออกมาเป็นค่า p เหมือนกัน แต่ความน่าเชื่อถือต่างกันครับ เหมือนกับเวลาคุณต้องการชั่งของสักชิ้น แล้วคุณชั่งด้วยเครื่องชั่งในตลาด กับชั่งด้วยเครื่องชั่งร้านทอง ก็ได้น้ำหนักเหมือนกันใช่ไหม แต่ถ้าเลือกได้ คุณจะเชื่อถือน้ำหนักจากไหนมากกว่ากัน ครับนั่นคือคำตอบว่า ทำไมสถิติแบบพาราจึงเป็นที่น่าเชื่อถือมากกว่าสถิติแบบนอนพารา        

  ถ้ามันน่าเชื่อถือมากกว่าอย่างนี้เวลาทำวิจัยเราก็วิเคราะห์แบบพาราเสียให้หมดก็ได้นี่  ใจเย็นๆ ครับ ใจเย็นๆ การทำงานวิจัยหลายๆ อย่างไม่มีข้อจำกัด อยากจะเก็บตัวอย่างมาวิเคราะห์เท่าไหร่ก็ได้ เช่นจะเพิ่มตัวอย่างอีกสัก 100 รายนะเหรอ เป็นเรื่องสบาย เ้อ้านี่ต้นฉบับเอาไปถ่ายเอกสารมา แล้วพรุ่งนี้ไปตามน้องๆที่เคยแจกแบบสอบถาม แล้วลุยกันได้เลย  แต่การทำงานวิจัยอีกหลายอย่างก็มีข้อจำกัด อย่างการทดลองในสัตว์ทดลองใหญ่ๆ เช่น ลิง แกะ ม้า และอื่นๆ มันไม่ใช่เรื่องง่ายที่จะเพิ่มจำนวน เพราะสัตว์ทดลองเหล่านี้ ต้องคัดสายพันธ์เป็นพิเศษ ตรวจสอบประวัติกันอย่างดี เลี้ยงดูในห้องพิเศษ อาหารสูตรพิเศษ ควบคุมสภาวะแวดล้อมพิเศษ และอีกสารพัด เหมือนที่อาจารย์ผมเคยเล่าให้ฟังว่า ที่มหาวิทยาลัยโตเกีียวนี้กำลังจะได้ลิงสำหรับทดลองมาเพิ่ม แล้วค่าใช้จ่ายในการดูแลลิงพวกนี้ต่อปีมากกว่าค่าจ้างอาจารย์ผมทั้งปี เห็นไหมว่าเขาดูแลลิงกันดีกว่าดูแลคนอีก เพราะฉะนั้นแม้อยากจะเพิ่มจำนวนตัวอย่างบางครั้งก็เพิ่มไม่ได้เหมือนใจคิด

     กลับมาทำความรู้จักกับสถิติแบบพารากับนอนพารากันต่อดีกว่า แล้วอย่างนี้เจ้าพารากับนอนพารามันต่างกันยังไง เจ้าพารา เป็นการวิเคราะห์อยู่บนความเชื่อที่ว่า

  • ตัวอย่างตรวจของเรามีปริมาณมากเพียงพอ อย่างน้อยก็ 20 หรือ 30 แล้วจะเอา 20 ดี หรือ 30 ดี เป็นเรื่องที่ตอบได้ยาก เพราะหนังสือบางเล่มก็บอกว่าตั้งแต่ 20 หนังสือบางเล่มก็บอกว่า มากกว่า 30 เอาเป็นว่า ขอให้มันเยอะไว้ก่อนก็แล้วกัน
  • ลักษณะการกระจายตัวของข้อมูลเป็นแบบโค้งปกติ คำว่าโค้งปกติ ก็หมายถึงว่าเป็นโค้งรูประฆังคว่ำสวยๆ ปั้นมากับมือ ถ้าผ่าครึ่งเมื่อไหร่แล้วเด็กไม่ร้อง เพราะสองคนได้ของเท่ากันล่ะก็ใช่เลย

     ส่วนเจ้านอนพาราก็ อยู่้พรรคฝ่ายค้านครับ ชอบทำตัวเหมือนผมในบางครั้ง ดังนั้นเจ้านอนพาราก็จะใช้วิเคราะห์อยู่บนข้อมูลประเภทที่

  • ตัวอย่างตรวจน้อยๆ  ส่วนใหญ่ก็มักจะน้อยกว่า 20
  • ลักษณะการกระจายตัวของข้อมูลไม่เป็นแบบโค้งปกติ เขาใช้คำว่าโค้งเบ้ซ้าย หรือโค้งเบ้ขวา เหมาะสำหรับเวลาแบ่งของแล้วต้องให้จับฉลากว่าใครจะโชคดีได้ของใหญ่กว่ากัน

     เริ่มต้นก็ลองดูก่อนว่า ข้อมูลของเรามีัลักษณะแบบไหน เป็นแบบ พาราเซตตามอน (พาราจริงๆ) หรือแบบพาราควอท (ไม่ใช่พาราก็เป็นนอนพารา) ต่อจากนั้นแล้่วค่อยมาว่ากันเรื่องของการวิเคราะห์ข้อมูลทีหลัง

     โอ๊ย ! เรื่องมันยาวจัง แล้วเมื่อไหร่จะได้รู้เสียทีว่า ข้อมูลของฉัน จะใช้สถิติตัวไหนวิเคราะห์

      ใจเย็นๆ ครับ เกือบถึงแล้ว อดใจรออีกนิดเดียว แล้วค่อยต่อกันตอนหน้าครับ