สถิติเชิงบรรยาย - Presentation Transcript
1. การแจกแจงความถี่ การแจกแจง ( Distribution) หมายถึง ลักษณะที่ ตัวแปรตัวหนึ่งจะมีค่าต่างๆ ในขอบเขตของค่าที่เป็นไปได้ ความถี่ ( Frequency) หมายถึง จำนวนรายการ ข้อมูลหรือจำนวนคะแนนที่ซ้ำกัน การแจกแจงความถี่ ( Frequency distribution) หมายถึง การแจกแจงจำนวนรายการข้อมูลหรือคะแนนที่ซ้ำกันที่ตกอยู่ในช่วงคะแนนที่กำหนดไว้
2. กลุ่ม / ไม่ต่อเนื่อง ( Categorical data) 2) การแจกแจงความถี่ของข้อมูลแบบต่อเนื่อง
- แจกแจงแบบไม่ต้องจัดเป็นกลุ่ม เป็นการเรียงลำดับคะแนน
- แจกแจงแบบจัดเป็นกลุ่ม
3. ขั้นตอนการสร้างตารางแจกแจงความถี่ 1) หาข้อมูลที่มีค่าสูงสุดและต่ำสุด 2) หาผลต่างระหว่างข้อมูลค่าสูงสุดกับต่ำสุด ( พิสัย ) 3) กำหนดจำนวนชั้น นิยมกำหนดระหว่าง 5-20 ชั้น 4) คำนวณหาขนาดความห่างของข้อมูลแต่ละชั้นหรืออันตรภาค ( Interval) จากสูตร i = (U – L) / N
3.1 โค้งของการแจกแจงความถี่ ถ้าให้คะแนนเป็นแกน X และจำนวนความถี่ เป็นแกน Y เขียนกราฟเส้นแสดงความสัมพันธ์จะได้ โค้งของการแจกแจงความถี่
3.2 โค้งปกติ ( Normal Curve จำนวนคนที่ได้คะแนนสูงและต่ำมีจำนวนน้อย คะแนนปานกลางมีจำนวนมากที่สุด ถ้าลากเส้นตรงจากจุดยอดโค้งมาตั้งฉากกับฐานแล้วพับตามรอยประ ส่วนโค้งจะทับกันสนิท Y X
เป็นรูประฆังคว่ำ ( bell shaped) มียอดเดียว
สมมาตร
Mean = Mode = median
Sk = 0, Ku = 0
พื้นที่ใต้โค้ง P( m + 1 s ) = 0.68 P( m + 2 s ) = 0.95 P ( m + 3 s ) = 0.99
คุณสมบัติของโค้งการแจกแจงปกติ
1) โค้งเบ้ทางบวก ( Positive Skewness) จำนวนคนที่ได้คะแนนต่ำมีจำนวนมาก คนที่ได้คะแนนสูงมีจำนวนน้อย Y X
2) โค้งเบ้ทางลบ ( Negative Skewness) จำนวนคนที่ได้คะแนนสูงมีจำนวนมาก คนที่ได้คะแนนต่ำมีจำนวนน้อย Y X
4. การวัดตำแหน่งเปรียบเทียบ (Measures of Relative Standing) อัตราส่วน (Ratio ) และสัดส่วน (Proportion )
อัตราส่วน เป็นการเปรียบเทียบความถี่ระหว่างรายการย่อยกับรายการย่อยของตัวแปร
อัตราส่วน = ความถี่ของ A
อัตราส่วน = ความถี่ของ A : ความถี่ของ B : ความถี่ของ C
ความถี่ของ B
สัดส่วน เป็นการเปรียบเทียบความถี่ระหว่างรายการย่อยกับจำนวนทั้งหมดของตัวแปรนั้น
สัดส่วน = ความถี่ของรายการ
ความถี่ทั้งหมด
ร้อยละ (Percent) เป็นการเปรียบเทียบความถี่ระหว่างรายการย่อยกับจำนวนทั้งหมดที่ ปรับเทียบให้เป็น 100 ค่าร้อยละจึงคำนวณเหมือนค่าสัดส่วนและปรับฐานให้เป็น 100
ร้อยละ = ความถี่ของรายการ x 100
ความถี่ทั้งหมด = สัดส่วน x 100
ควอร์ไทล์ (Quartile) เดไซล์ (Decile) และเปอร์เซนไทล์ (Percentile)
ควอร์ไทล์ ( Quartile) เป็นค่าที่แบ่งข้อมูลซึ่งเรียงตามขนาดออกเป็น 4 ส่วนเท่าๆกัน จึงมีค่าเป็น Q 1 , Q 2 และ Q 3 ตามลำดับ
เดไซล์ (Decile) เป็นค่าที่แบ่งข้อมูลเรียงตามขนาดออกเป็น 10 ส่วนเท่าๆกัน จึงมีค่าเป็น D 1 , D 2 , …, และ D 9 ตามลำดับ
เปอร์เซนไทล์ (Percentile) เป็นค่าที่แบ่งข้อมูลเรียงตามขนาดออกเป็น 100 ส่วนเท่าๆกัน จึงมีค่าเป็น P 1 , P 2 , …, และ P 99 ตามลำดับ
ความสัมพันธ์ระหว่างค่าควอร์ไทล์ (Q) เดไซล์ (D) และเปอร์เซนไทล์ (P) ค่าน้อย ค่ามาก Q 1 Q 2 Q 3 D 1 D 2 D 3 D 4 D 5 D 6 D 7 D 8 D 9 P 1 P 10 P 20 P 30 P 40 P 50 P 60 P 70 P 80 P 90 P 100
การวัดแนวโน้มเข้าสู่ส่วนกลาง และการวัดการกระจาย ( Measures of Central Tendency)
การวัดแนวโน้มเข้าสู่ส่วนกลาง เป็นการคำนวณค่ากลางของชุดข้อมูลของตัวแปรที่สนใจศึกษา
การวัดแนวโน้มเข้าสู่ส่วนกลาง
1. ฐานนิยม ( Mode)
ฐานนิยม (Mode) ของชุดข้อมูลคือ ค่าที่มีความถี่สูงสุด หรือค่าที่เกิดขึ้นบ่อยครั้งที่สุด ข้อมูลบางชุดอาจมีค่าฐานนิยมมากกว่า 1 ค่า หรือไม่มีฐานนิยมก็ได้
2. มัธยฐาน (Median)
มัธยฐาน (Med) ของชุดข้อมูล คือ ค่าที่อยู่ตรงกลาง หรือกึ่งกลางของตัวเลขที่เรียงลำดับ ค่ามัธยฐาน อาจเป็นค่ากลางที่ตรงกับค่าจริงของข้อมูลหรืออาจเป็นค่าเฉลี่ยของค่าที่อยู่ตรงกลาง
3. ค่าเฉลี่ยเลขคณิต (Arithmetic Mean)
ค่าเฉลี่ยเลขคณิต (AM) ของชุดข้อมูลคือ ค่าที่เกิดจากการรวมกันของข้อมูลทุกตัวแล้วหารด้วยจำนวนข้อมูล
4. พิสัย (Range)
พิสัย (R) ของชุดข้อมูล คือผลต่างระหว่างข้อมูลที่มีค่าสูงสุดกับข้อมูลที่มีค่าต่ำสุดของข้อมูลชุดนั้น
การวัดการกระจาย (Measures of Dispersion)
ส่วนเบี่ยงเบนควอร์ไทล์ (Quartile Deviation)
ส่วนเบี่ยงเบนควอร์ไทล์ (QD) คือ ครึ่งหนึ่งของความแตกต่างระหว่างระหว่างค่าควอร์ไทล์ที่ 3 กับค่าควอร์ไทล์ 1
QD = (Q3-Q1) / 2
ส่วนเบี่ยงเบนมาตรฐาน (Standard Deviation)
ส่วนเบี่ยงเบนมาตรฐาน (S . D . หรือ S ) คือ ค่ารากที่สองของกำลังสองเฉลี่ยของส่วนเบี่ยงเบนระหว่างค่าของข้อมูลแต่ละตัวกับค่าเฉลี่ยเลขคณิตของข้อมูลชุดนั้น หรือเป็นค่ารากที่สองของส่วนเบี่ยงเบนกำลังสองเฉลี่ย
S . D . = Ö [ S ( x - x )] 2 / N
ความแปรปรวน ( Variance)
ความแปรปรวนของข้อมูล (S 2 , s 2 ) คือ ค่ากำลังสองของส่วนเบี่ยงเบนมาตรฐาน
เมื่อ S, S 2 = สัญลักษณ์แทนส่วนเบี่ยงเบนมาตรฐาน และความแปรปรวนของข้อมูลกลุ่มตัวอย่างตามลำดับ
เมื่อ s , s 2 = สัญลักษณ์แทนส่วนเบี่ยงเบนมาตรฐาน และความแปรปรวนของข้อมูลประชากรตามลำดับ
สัมประสิทธิ์การกระจาย (Coefficient of variation)
สัมประสิทธิ์การกระจาย หรือ CV (%) เป็นค่าการกระจายของส่วนเบี่ยงเบนมาตรฐาน เมื่อกำหนดให้ค่าเฉลี่ยเลขคณิตเป็น 100
CV = (S . D . x 100) / X
คะแนนชุดหนึ่งที่มีคะแนนเฉลี่ยเป็นศูนย์ ความแปรปรวนเป็นหนึ่ง 9.5 คะแนนมาตรฐาน ( Standard Scores)
ที่มา คะแนนดิบแต่ละตัวไม่มีความหมายดีพอในการเปรียบเทียบ จึงได้นำคะแนนดิบไปหาความสัมพันธ์กับค่าเฉลี่ยและส่วนเบี่ยงเบนมาตรฐานของ ข้อมูลชุดนั้นว่า คะแนนดิบแต่ละตัวอยู่ห่างจากค่ากลาง ( ค่าเฉลี่ย ) เป็นกี่เท่าของ ส่วนเบี่ยงเบนมาตรฐาน ( S.D. )
การแปลงคะแนนดิบเป็นคะแนนมาตรฐาน Z = (x – x) / S.D. (Mean = 0, S.D. = 1) Z – score T = 50 + 10Z (Mean = 50, S = 10) T - score
ไม่มีความเห็น