สถิติเชิงบรรยาย

สถิติเชิงบรรยาย - Presentation Transcript

1. การแจกแจงความถี่ การแจกแจง ( Distribution) หมายถึง ลักษณะที่ ตัวแปรตัวหนึ่งจะมีค่าต่างๆ ในขอบเขตของค่าที่เป็นไปได้ ความถี่ ( Frequency) หมายถึง จำนวนรายการ ข้อมูลหรือจำนวนคะแนนที่ซ้ำกัน การแจกแจงความถี่ ( Frequency distribution) หมายถึง การแจกแจงจำนวนรายการข้อมูลหรือคะแนนที่ซ้ำกันที่ตกอยู่ในช่วงคะแนนที่กำหนดไว้

2. กลุ่ม / ไม่ต่อเนื่อง ( Categorical data) 2) การแจกแจงความถี่ของข้อมูลแบบต่อเนื่อง

- แจกแจงแบบไม่ต้องจัดเป็นกลุ่ม เป็นการเรียงลำดับคะแนน

- แจกแจงแบบจัดเป็นกลุ่ม

3. ขั้นตอนการสร้างตารางแจกแจงความถี่ 1) หาข้อมูลที่มีค่าสูงสุดและต่ำสุด 2) หาผลต่างระหว่างข้อมูลค่าสูงสุดกับต่ำสุด ( พิสัย ) 3) กำหนดจำนวนชั้น นิยมกำหนดระหว่าง 5-20 ชั้น 4) คำนวณหาขนาดความห่างของข้อมูลแต่ละชั้นหรืออันตรภาค ( Interval) จากสูตร i = (U – L) / N

3.1 โค้งของการแจกแจงความถี่ ถ้าให้คะแนนเป็นแกน X และจำนวนความถี่ เป็นแกน Y เขียนกราฟเส้นแสดงความสัมพันธ์จะได้ โค้งของการแจกแจงความถี่

3.2 โค้งปกติ ( Normal Curve จำนวนคนที่ได้คะแนนสูงและต่ำมีจำนวนน้อย คะแนนปานกลางมีจำนวนมากที่สุด ถ้าลากเส้นตรงจากจุดยอดโค้งมาตั้งฉากกับฐานแล้วพับตามรอยประ ส่วนโค้งจะทับกันสนิท Y X

เป็นรูประฆังคว่ำ ( bell shaped) มียอดเดียว

สมมาตร

Mean = Mode = median

Sk = 0, Ku = 0

พื้นที่ใต้โค้ง P( m + 1 s ) = 0.68 P( m + 2 s ) = 0.95 P ( m + 3 s ) = 0.99

คุณสมบัติของโค้งการแจกแจงปกติ

1) โค้งเบ้ทางบวก ( Positive Skewness) จำนวนคนที่ได้คะแนนต่ำมีจำนวนมาก คนที่ได้คะแนนสูงมีจำนวนน้อย Y X

2) โค้งเบ้ทางลบ ( Negative Skewness) จำนวนคนที่ได้คะแนนสูงมีจำนวนมาก คนที่ได้คะแนนต่ำมีจำนวนน้อย Y X

4. การวัดตำแหน่งเปรียบเทียบ (Measures of Relative Standing) อัตราส่วน (Ratio ) และสัดส่วน (Proportion )

อัตราส่วน เป็นการเปรียบเทียบความถี่ระหว่างรายการย่อยกับรายการย่อยของตัวแปร

อัตราส่วน = ความถี่ของ A

อัตราส่วน = ความถี่ของ A : ความถี่ของ B : ความถี่ของ C

ความถี่ของ B

สัดส่วน เป็นการเปรียบเทียบความถี่ระหว่างรายการย่อยกับจำนวนทั้งหมดของตัวแปรนั้น

สัดส่วน = ความถี่ของรายการ

ความถี่ทั้งหมด

ร้อยละ (Percent) เป็นการเปรียบเทียบความถี่ระหว่างรายการย่อยกับจำนวนทั้งหมดที่ ปรับเทียบให้เป็น 100 ค่าร้อยละจึงคำนวณเหมือนค่าสัดส่วนและปรับฐานให้เป็น 100

ร้อยละ = ความถี่ของรายการ x 100

ความถี่ทั้งหมด = สัดส่วน x 100

ควอร์ไทล์ (Quartile) เดไซล์ (Decile) และเปอร์เซนไทล์ (Percentile)

ควอร์ไทล์ ( Quartile) เป็นค่าที่แบ่งข้อมูลซึ่งเรียงตามขนาดออกเป็น 4 ส่วนเท่าๆกัน จึงมีค่าเป็น Q 1 , Q 2 และ Q 3 ตามลำดับ

เดไซล์ (Decile) เป็นค่าที่แบ่งข้อมูลเรียงตามขนาดออกเป็น 10 ส่วนเท่าๆกัน จึงมีค่าเป็น D 1 , D 2 , …, และ D 9 ตามลำดับ

เปอร์เซนไทล์ (Percentile) เป็นค่าที่แบ่งข้อมูลเรียงตามขนาดออกเป็น 100 ส่วนเท่าๆกัน จึงมีค่าเป็น P 1 , P 2 , …, และ P 99 ตามลำดับ

ความสัมพันธ์ระหว่างค่าควอร์ไทล์ (Q) เดไซล์ (D) และเปอร์เซนไทล์ (P) ค่าน้อย ค่ามาก Q 1 Q 2 Q 3 D 1 D 2 D 3 D 4 D 5 D 6 D 7 D 8 D 9 P 1 P 10 P 20 P 30 P 40 P 50 P 60 P 70 P 80 P 90 P 100

การวัดแนวโน้มเข้าสู่ส่วนกลาง และการวัดการกระจาย ( Measures of Central Tendency)

การวัดแนวโน้มเข้าสู่ส่วนกลาง เป็นการคำนวณค่ากลางของชุดข้อมูลของตัวแปรที่สนใจศึกษา

การวัดแนวโน้มเข้าสู่ส่วนกลาง

1. ฐานนิยม ( Mode)

ฐานนิยม (Mode) ของชุดข้อมูลคือ ค่าที่มีความถี่สูงสุด หรือค่าที่เกิดขึ้นบ่อยครั้งที่สุด ข้อมูลบางชุดอาจมีค่าฐานนิยมมากกว่า 1 ค่า หรือไม่มีฐานนิยมก็ได้

2. มัธยฐาน (Median)

มัธยฐาน (Med) ของชุดข้อมูล คือ ค่าที่อยู่ตรงกลาง หรือกึ่งกลางของตัวเลขที่เรียงลำดับ ค่ามัธยฐาน อาจเป็นค่ากลางที่ตรงกับค่าจริงของข้อมูลหรืออาจเป็นค่าเฉลี่ยของค่าที่อยู่ตรงกลาง

3. ค่าเฉลี่ยเลขคณิต (Arithmetic Mean)

ค่าเฉลี่ยเลขคณิต (AM) ของชุดข้อมูลคือ ค่าที่เกิดจากการรวมกันของข้อมูลทุกตัวแล้วหารด้วยจำนวนข้อมูล

4. พิสัย (Range)

พิสัย (R) ของชุดข้อมูล คือผลต่างระหว่างข้อมูลที่มีค่าสูงสุดกับข้อมูลที่มีค่าต่ำสุดของข้อมูลชุดนั้น

การวัดการกระจาย (Measures of Dispersion)

ส่วนเบี่ยงเบนควอร์ไทล์ (Quartile Deviation)

ส่วนเบี่ยงเบนควอร์ไทล์ (QD) คือ ครึ่งหนึ่งของความแตกต่างระหว่างระหว่างค่าควอร์ไทล์ที่ 3 กับค่าควอร์ไทล์ 1

QD = (Q3-Q1) / 2

ส่วนเบี่ยงเบนมาตรฐาน (Standard Deviation)

ส่วนเบี่ยงเบนมาตรฐาน (S . D . หรือ S ) คือ ค่ารากที่สองของกำลังสองเฉลี่ยของส่วนเบี่ยงเบนระหว่างค่าของข้อมูลแต่ละตัวกับค่าเฉลี่ยเลขคณิตของข้อมูลชุดนั้น หรือเป็นค่ารากที่สองของส่วนเบี่ยงเบนกำลังสองเฉลี่ย

S . D . = Ö [ S ( x - x )] 2 / N

ความแปรปรวน ( Variance)

ความแปรปรวนของข้อมูล (S 2 , s 2 ) คือ ค่ากำลังสองของส่วนเบี่ยงเบนมาตรฐาน

เมื่อ S, S 2 = สัญลักษณ์แทนส่วนเบี่ยงเบนมาตรฐาน และความแปรปรวนของข้อมูลกลุ่มตัวอย่างตามลำดับ

เมื่อ s , s 2 = สัญลักษณ์แทนส่วนเบี่ยงเบนมาตรฐาน และความแปรปรวนของข้อมูลประชากรตามลำดับ

สัมประสิทธิ์การกระจาย (Coefficient of variation)

สัมประสิทธิ์การกระจาย หรือ CV (%) เป็นค่าการกระจายของส่วนเบี่ยงเบนมาตรฐาน เมื่อกำหนดให้ค่าเฉลี่ยเลขคณิตเป็น 100

CV = (S . D . x 100) / X

คะแนนชุดหนึ่งที่มีคะแนนเฉลี่ยเป็นศูนย์ ความแปรปรวนเป็นหนึ่ง 9.5 คะแนนมาตรฐาน ( Standard Scores)

ที่มา คะแนนดิบแต่ละตัวไม่มีความหมายดีพอในการเปรียบเทียบ จึงได้นำคะแนนดิบไปหาความสัมพันธ์กับค่าเฉลี่ยและส่วนเบี่ยงเบนมาตรฐานของ ข้อมูลชุดนั้นว่า คะแนนดิบแต่ละตัวอยู่ห่างจากค่ากลาง ( ค่าเฉลี่ย ) เป็นกี่เท่าของ ส่วนเบี่ยงเบนมาตรฐาน ( S.D. )

การแปลงคะแนนดิบเป็นคะแนนมาตรฐาน Z = (x – x) / S.D. (Mean = 0, S.D. = 1) Z – score T = 50 + 10Z (Mean = 50, S = 10) T - score

ความเห็น

บทความในวันเดียวกัน