เอกสารประกอบการสอน วิชา สถิติเพื่อการวิจัย :
สถิติ (STATISTICS)
ขอบข่ายของความหมายของคำว่า “สถิติ” มีหลายประเด็นและได้ขยายกว้างขวางออกไปอย่างรวดเร็วจนถึงศตวรรษที่ 20 จากสถิติที่มีความหมายถึงข้อมูลเกี่ยวกับการบริหารของรัฐแล้ว สถิติได้พัฒนาเป็นข้อมูลแสดงสภาพทางเศรษฐกิจและสังคม ข้อมูลที่เป็นตัวชี้วัดให้เห็นถึงการเปลี่ยนแปลงของสิ่งที่สนใจ แนวทางในการดำเนินธุรกิจ เช่น ข้อมูลเกี่ยวกับการอากาศยาน ซึ่งจะมีข้อมูลที่จำเป็นมากมาย ได้แก่ เกี่ยวกับภูมิอากาศ เกี่ยวกับสภาพภูมิประเทศ เกี่ยวกับสภาพของผู้โดยสาร หรือข้อมูลทางการแพทย์ เหล่านี้เป็นต้น จนกระทั่งถึงปัจจุบัน วิวัฒนาการทางสถิติศาสตร์ก็มีการพัฒนามากยิ่งขึ้นและเกี่ยวข้องกับเรื่องต่าง ๆ เกือบทั้งหมด สถิติศาสตร์จึงมีความสำคัญมากขึ้นพร้อม ๆ กับการเปลี่ยนแปลงของสังคมในปัจจุบันที่มีความสลับซับซ้อน เพราะยิ่งสังคมมีความสลับซับซ้อนมากขึ้นเพียงไร ก็ยิ่งมีความจำเป็นต้องทำการเก็บข้อมูลเกี่ยวกับสังคมมากขึ้นนั่นเอง เพื่อทำความเข้าใจในสังคมนั้นอย่างลึกซึ้ง ด้วยเหตุผลดังกล่าวทำให้เราต้องทราบข้อเท็จจริง และความเป็นไปของสังคม จึงจำเป็นต้องใช้เครื่องมืออย่างใดอย่างหนึ่งช่วยในการตัดสินใจ เครื่องมือนี้ก็คือ สถิติ ตัวอย่างเช่น เทคนิคว่าด้วยการสุ่มตัวอย่าง และการประมาณข้อมูลจากตัวอย่างได้ถูกนำมาใช้อย่างกวางขวางในการเก็บรวบรวมข้อมูลระดับชาติและการรวบรวมข้อมูลเพื่อการวิเคราะห์วิจัยในส่วนที่สนใจ
สถิติจัดได้ว่าเป็นทั้งวิทยาศาสตร์ และศิลปะ เช่นเดียวกับคณิตศาสตร์ โดยจะประกอบด้วย กระบวนการที่จะทำให้ได้ข่าวสารต่าง ๆ ในเรื่องที่ต้องการจะศึกษา การจัดเป็นหมวดหมู่และการนำเสนอ ซึ่งมีส่วนของศิลปะมาผสมผสานด้วย และในส่วนที่เป็นกระบวนการทางวิทยาศาสตร์ จะประกอบด้วยขั้นตอนที่จะทำให้ได้ค่าสังเกตต่าง ๆ ที่เราต้องการศึกษาอย่างเหมาะสม มีเหตุมีผลสามารถตรวจสอบได้ ดังนั้นจึงมีรูปแบบในการวัด หรือการสังเกตมากมาย
ประเภทของสถิติ
นักคณิตศาสตร์ได้แบ่งสถิติในฐานะที่เป็นศาสตร์ออกเป็นสาขาใหญ่ ๆ 2 สาขาด้วยกัน คือ สถิติเชิงพรรณนา (Descriptive Statistics) และการอนุมานเชิงสถิติ หรือ สถิติเชิงอนุมาน (Inferential Statistics) ซึ่งแต่ละสาขามีรายละเอียดดังนี้
1.สถิติพรรณนา (Descriptive Statistics) หมายถึง การบรรยายลักษณะของข้อมูล (Data) ที่ผู้วิจัยเก็บรวบรวมจากประชากรหรือกลุ่มตัวอย่างที่สนใจ ซึ่งอาจจะแสดงในรูป ค่าเฉลี่ย มัธยฐาน ฐานนิยม ร้อยละ ส่วนเบี่ยงเบนมาตรฐาน ความแปรปรวน เป็นต้น
2.สถิติเชิงอนุมาน (Inferential Statistics) หมายถึง สถิติที่ว่าด้วยการวิเคราะห์ข้อมูลที่รวบรวมมาจากกลุ่มตัวอย่าง เพื่ออธิบายสรุปลักษณะบางประการของประชากร โดยมีการนำทฤษฎีความน่าจะเป็นมาประยุกต์ใช้ สถิติสาขานี้ ได้แก่ การประมาณค่าทางสถิติ การทดสอบสมมุติฐานทางสถิติ การวิเคราะห์การถดถอยและสหสัมพันธ์ เป็นต้น
ข้อมูล
ข้อมูล(Data) หมายถึง ข้อมูลหรือตัวเลขที่แสดงคุณสมบัติที่ผู้วิจัยต้องการศึกษา เช่น อายุ รายได้ ยอดขาย เป็นต้น
ประเภทของข้อมูล
ข้อมูลที่เก็บรวบรวมมา ไม่ว่าจะใช้ในงานวิจัย หรือวัตถุประสงค์อื่นใดก็ตาม ย่อมมีลักษณะแตกต่างกันไป โดยการจำแนกข้อมูล อาจจำแนกตามเกณฑ์ใหญ่ ๆ ได้ 3 ประการ คือ จำแนกตามแหล่งข้อมูล จำแนกตามลักษณะของข้อมูล และจำแนกตามมาตรการวัด เป็นต้น
จำแนกตามแหล่งข้อมูล
1. ข้อมูลปฐมภูมิ (Primary Data) หมายถึง ข้อมูลที่ผู้วิจัยเป็นผู้เก็บรวบรวมข้อมูลที่สนใจเอง โดยที่อาจจะใช้วิธีเก็บแบบสอบถาม แบบสัมภาษณ์ การทดลอง เป็นต้น
2. ข้อมูลทุติยภูมิ (Secondary Data) หมายถึง ข้อมูลที่ผู้วิจัยไม่ได้เป็นผู้เก็บรวบรวมข้อมูลที่สนใจเอง โดยนำข้อมูลที่ผู้อื่น ๆ เก็บมาใช้ เช่น ข้อมูลเกี่ยวกับการจ้างงานที่กระทรวงแรงงานรวบรวมไว้ เป็นต้น
จำแนกตามลักษณะของข้อมูล
1.ข้อมูลเชิงปริมาณ (Quantitative Data) หมายถึง ข้อมูลที่สามารถแสดงในรูปตัวเลขได้ เช่น น้ำหนัก อายุ คะแนน จำนวนสินค้า งบประมาณ จำนวนพนักงานในบริษัท เป็นต้น ข้อมูลเชิงปริมาณยังแบ่งได้ ๒ ประเภท คือ
1.1 ข้อมูลแบบต่อเนื่อง (Continuous Data) หมายถึงข้อมูลที่มีค่าต่าง ๆ ทุกค่าต่อเนื่องกัน โดยแสดงได้ทั้งเศษส่วนหรือตัวเลขที่เป็นจำนวนเต็ม เช่น ส่วนสูง น้ำหนัก ความยาวของโต๊ะ
1.2 ข้อมูลแบบไม่ต่อเนื่อง (Discrete Data) หมายถึงข้อมูลที่มีค่าเป็นจำนวน
เต็มหรือจำนวนนับ เช่น ค่าใช้จ่าย จำนวนสินค้า งบประมาณ จำนวนพนักงานในบริษัท
2.ข้อมูลเชิงคุณภาพ (Qualitative Data) หมายถึง ข้อมูลที่ไม่สามารถแสดงในรูปตัวเลขได้ หรือ อาจจะแสดงในรูปตัวเลขได้แต่ไม่สามารถคำนวณในเชิงปริมาณได้ เนื่องจากตัวเลขเหล่านั้นไม่สามารถอธิบายได้ เช่น เพศ สถานภาพ วุฒิการศึกษา เป็นต้น
จำแนกตามมาตรการวัด
1. นามบัญญัติ (Nominal Scales) คือระดับของข้อมูลที่เป็นการกำหนดชื่อหรือแบ่งแยกประเภทของสิ่งต่าง ๆ เช่น เบอร์โทรศัพท์ ห้องเรียน อาคารเรียน บ้านเลขที่ เป็นต้น
2. เรียงลำดับ (Ordinal Scales) คือระดับของข้อมูลที่สามารถจัดลำดับความสำคัญของข้อมูลตามความแตกต่างได้ เช่น ชอบมาก ชอบปานกลาง ชอบน้อย ไม่ชอบ เป็นต้น
3. อันตรภาค (Interval Scales) คือระดับของข้อมูลที่สามารถบอกถึงปริมาณของความแตกต่างของข้อมูลได้ แต่ไม่มีศูนย์แท้ เช่น อุณหภูมิ คะแนนสอบวัดความรู้ ความสูง เป็นต้น
4. อัตราส่วน (Ratio Scales) คือระดับของข้อมูลที่เป็นการบอกถึงปริมาณความแตกต่างของข้อมูลที่มีรายละเอียดมากที่สุดและมีศูนย์แท้ เช่น ระยะทาง น้ำหนัก ความเร็ว เป็นต้น
1. ข้อมูลที่ไม่ได้แบ่งกลุ่ม (ungrouped Data) เป็นข้อมูลที่เก็บจากลักษณะของแต่ละหน่วยประชากร หรือ หน่วยตัวอย่าง เช่นข้อมูลอายุของคนกลุ่มหนึ่ง 15 , 18 , 20 , 25 , 23 , 14 , 22 ปี เป็นต้น
2. ข้อมูลที่แบ่งกลุ่ม (grouped Data) เป็นข้อมูลที่จัดแบ่งเป็นกลุ่ม ๆ เป็นอันตรภาคชั้น เช่น อายุของคนกลุ่มหนึ่ง คือ 15-20,21-26,27-32 ปี เป็นต้น
ค่าเฉลี่ย ()
กรณีข้อมูลที่ไม่ได้แบ่งกลุ่ม หรือ
กรณีข้อมูลที่แบ่งกลุ่ม หรือ
มัธยฐาน(median)
กรณีข้อมูลที่ไม่ได้แบ่งกลุ่ม ให้เรียงข้อมูลจากน้อยไปมากแล้วพิจารณาข้อมูลที่อยู่ตรงกลาง
กรณีข้อมูลที่แบ่งกลุ่ม Med =
ฐานนิยม(mode)
กรณีข้อมูลที่แบ่งกลุ่ม Mo =
การวัดการกระจายของข้อมูล (Measures of Variation)
-พิสัย (Range) = MAX – MIN
-ส่วนเบี่ยงเบนควอไทล์ (Quartile Deviation) =
-ส่วนเบี่ยงเบนเฉลี่ย (Mean Deviation)
กรณีข้อมูลที่ไม่ได้แบ่งกลุ่ม MD. =
กรณีข้อมูลที่แบ่งกลุ่ม MD. =
-ส่วนเบี่ยงเบนมาตรฐาน(Standard Deviation ) และความแปรปรวน (Variance)
-ส่วนเบี่ยงเบนมาตรฐาน (Standard Deviation)
กรณีข้อมูลที่ไม่ได้แบ่งกลุ่ม SD. = , S =
กรณีที่ข้อมูลแบ่งกลุ่ม SD. = , S =
-ความแปรปรวน (Variance)
กรณีข้อมูลที่ไม่ได้แบ่งกลุ่ม , S2 =
กรณีข้อมูลที่แบ่งกลุ่ม , S2 =
กระบวนการทางสถิติ
การนำสถิติไปใช้ประโยชน์มีกระบวนการโดยทั่วไป คือ
1. การวางแผน (Planning) ก่อนจะมีการวางแผนต้องมีหัวข้อเรื่องที่จะศึกษา อาทิ การแก้ไขปัญหาเกี่ยวกับเรื่องใดเรื่องหนึ่งสมมติเป็นปัญหาเกี่ยวกับการขาดแคลนที่จอดรถในมหาวิทยาลัย ผู้ที่เป็นเจ้าของปัญหา คือ ผู้บริหารของมหาวิทยาลัย ต้องวางแผนการแก้ปัญหา โดยจัดหาสถานที่ให้เพียงพอ โดยต้องมีการวางแผนการสำรวจที่ว่าง ซึ่งจะปรับปรุงเป็นที่จอดรถได้ ในขั้นตอนนี้ต้องกำหนดว่าจะกำหนดวิธีการสำรวจอย่างไรจะใช้อะไรเป็นข้อมูลประกอบการพิจารณาบ้าง ถ้ามีข้อมูลเกี่ยวกับคนเข้ามาเกี่ยวข้องด้วย ก็ต้องกำหนดว่าจะกำหนดให้ผู้คนประเภทใดบ้างที่จะไปสอบถามรายละเอียด จะใช้จำนวนเท่าใดจึงจะพอดีที่จะต้องใช้ในขั้นตอนนี้ทั้งหมด รวมถึงวิธีการรวบรวมข้อมูล และกำหนดวิธีการทดสอบข้อมูลด้วย ขั้นตอนนี้ถือว่าเป็นขั้นตอนที่สำคัญ ถ้าวางแผนงานได้ดีก็นับว่าทำสำเร็จไปครึ่งหนึ่งแล้ว
2. การเก็บรวบรวมข้อมูล (Collection of Data) เมื่อกำหนดในขั้นตอนที่ 1 แล้วว่าจะนำอะไรมาเป็นข้อมูลก็จะทำการรวบรวมตามวิธีทางสถิติซึ่งจะได้กล่าวต่อไป
3. การนำเสนอข้อมูล (Presentation of Data) เมื่อรวบรวมได้แล้วก็จะนำมาแสดงให้คนเข้าใจ ซึ่งอาจจะแสดงในรูปตารางสถิติ เป็นรูปภาพ หรือเป็นแบบเส้นโค้ง ฯลฯ
4.การวิเคราะห์ข้อมูล (Analysis of Data) เมื่อได้ข้อมูลตามต้องการแล้วก็จะนำมาวิเคราะห์ ซึ่งอาจอยู่ในรูป ค่าเฉลี่ย ค่าร้อยละ ค่าสัดส่วน หรือค่าใด ๆ ตามแต่จะกำหนดไว้ในขั้นตอนที่ 1
5. การตีความ (Interpretation of Data) เป็นขั้นตอนสุดท้าย คือ การสรุปผลการวิเคราะห์ในขั้นตอนที่ 4 รวมถึงการนำเอาผลที่ได้ไปอ้างอิงใช้กับส่วนอื่นด้วย อาทิ นำผลการวิเคราะห์เกี่ยวกับการเจริญเติบโตของเด็กในวัย 5-7 ขวบ ของข้อมูลตัวอย่างไปใช้กับเด็กวัย 5-7 ขวบ ทั่วประเทศ เป็นต้น
กิจกรรม
1. จากข้อมูลกลุ่มตัวอย่าง 25,15,28,45,20,34
จงหา 1. ค่าเฉลี่ย
2.มัธยฐาน
3.ฐานนิยม
4.ส่วนเบี่ยงเบนมาตรฐาน
2.ในการศึกษาค่าใช้จ่ายของกลุ่มตัวอย่างนักศึกษา 50 คน ได้ข้อมูลดังนี้
ค่าใช้จ่าย(บาท) |
จำนวน |
28 - 32 33 - 37 38 - 42 43 - 47 48 - 52 53 - 57 58 - 62 63 - 67 68 - 72 73 - 77 |
2 2 2 4 5 7 4 7 9 8 |
จงหา 1.ค่าเฉลี่ย
2.มัธยฐาน
3.ฐานนิยม
4.ส่วนเบี่ยงเบนมาตรฐาน และความแปรปรวน
น่าเสียดายจังเลยค่ะ อ. ขา ตั้งใจเรียนเลยนะคะนี่ แต่สงสัยคอมของครูต้อยมันกลัวเลยออกอาการ
แต่ตัวเองไม่กลัวนะคะ สู้ค่ะ อยากเรียนรู้จริงๆ
แต่....ข้อมูลตั้งแต่ grouped Data จนถึง Variance มันหายไปบางตอนทำให้การอ่านเนื้อหาตรงนี้สะดุดนะคะ
ขอความกรุณาท่านอาจารย์ ช่วยแนะนำด้วยค่ะ
ขอบคุณค่ะ
ลองดูใหม่นะคะ ดนเองก็เพิ่งศึกษา มีอะไรใหม่จะแจ้งให้ทราบ
ยินดีที่ครูต้อยสนใจ