ค่าทางสถิติบางตัวที่เป็นประโยชน์ในทางวิทยาการระบาด
ระดับของการวัดของตัวแปร
ระดับของการวัดของตัวแปร จะเป็นตัวบ่งชี้ว่า จะใช้สถิติตัวใด ที่เหมาะสมในการศึกษาตัวแปรนั้นๆ แบ่งออกได้เป็น 4 ประเภท
เป็นการวัดแบบแบ่งกลุ่มโดยใช้ชื่อตัวแปรในการศึกษา โดยหลักเกณฑ์กว้างๆ ของลักษณะของลักษณะของตัวแปร ที่ทำการศึกษา แล้วจัดกลุ่มที่มีลักษณะหรือคุณสมบัติ เหมือนกันไว้ในกลุ่มเดียวกัน เช่น
การแบ่งกลุ่มโดยใช้เพศ -ตัวผู้/ตัวเมีย
ศาสนา - พุทธ คริสต์ อิสลาม ฯลฯ
ระบบการเลี้ยงสัตว์ - ระบบปิด ระบบเปิด
ตัวแปรสามารถจัดอันดับสูง กลาง ต่ำ ได้โดยการเรียงลำดับอาจอาศัยเกณฑ์ใดเกณฑ์ ใดเกณฑ์หนึ่ง เช่น ความสูง ต่ำ ความสวย ความฉลาด ขนาดใหญ่ เล็ก เป็นต้น ซึ่งการเปรียบเทียบจะสามารถบอกความแตกต่างในเชิงคุณลักษณะ แต่ไม่สามารถบอกปริมาณความแตกต่างในแต่ละอันดับได้
เช่น ขนาดของฟาร์ม -เล็ก กลาง ใหญ่
ความสวย - สวยน้อย สวยปานกลาง สวยมาก
เป็นการการวัดที่มีคุณสมบัติที่วัดระดับช่วง ทำให้ความห่างระหว่างช่อง เท่าๆกัน มีการกำหนดค่าที่เป็นสัญลักษณ์ ซึ่งสามารถนำมาคำนวณและบอกความแตกต่างได้
เป็นการวัดที่มีคุณสมบัติของการวัดข้อมูลเชิงปริมาณ มีลักษณะคล้ายกับมาตราเชิงอัตราภาค แต่มีข้อแตกต่าง คือ มีจุดเริ่มต้น ตามธรรมชาติ เช่น ความยาว น้ำหนัก ส่วนสูง เป็นต้น
ค่าสถิติ บางตัวที่ใช้ในทางวิทยาการระบาด
1. การวัดแนวโน้มเข้าสู่ส่วนกลาง
ก. ค่ามัชฌิมเลขคณิต เป็นค่าเฉลี่ยอย่างง่ายของกลุ่มที่เราสังเกต หาได้จากผลรวมของสิ่งที่เราสังเกตทั้งหมด หารด้วยจำนวนที่เราสังเกต
X = E Xi
N
เช่น 4 , 5 ,9 ,1 , 2
ค่าเฉลี่ย = 4+5+9+1+2 = 4.2
5
ข. มัธยฐาน (Median) หมายถึง ค่ากลางของสิ่งที่เราสังเกต เมื่อนำสิ่งที่เราสังเกตมาเรียงลำดับจากน้อย ไปหา มาก มีวีธีการหาได้ดังนี้
1, 2 ,4, 5 ,9 ค่ามัธยฐาน คือ 4
1, 2 ,2 ,4, 5, 9 ค่ามัธยฐาน คือ 2+4 = 3
2
ค. ฐานนิยม (Mode) ค่าที่มีความถี่มากที่สุดในกลุ่มของค่ที่เราสังเกตในข้อมูล ชุดหนึ่งอาจมีค่าฐานนิยมหลายค่าก็ได้
1, 2 ,2 ,4, 5, 9
ฐานนิยม = 2
ง.. มัชฌิมเรขาคณิต (Geometric mean) เป็นค่านิยมที่ใช้ในทางซีรั่มวิทยา ซึ่ง titer มักถูกทำให้เจือจางลงทีละครึ่ง เช่น 1/20 , 1/40 ,1/80 เป็นต้น เมื่อตัวส่วนที่เพิ่มขึ้นโดยการคุณด้วยค่าคงที่ ค่า Logarithm ของค่าเหล่านี้จะมีความแตกต่างที่คงที่ด้วย เมื่อนำค่า Logarithm ของค่า titer มาทำเป็นกราฟ จะทำให้กราฟมีลักษณะการกระจายปกติ
ตัวอย่าง 1/20 , 1/40 ,1/80 , 1/240
Log 20 = 1.3010
Log 40 = 1.6021
Log 80 = 1.9031
2. การวัดการกระจาย (Measure of Variability)
ก. พิสัย (Range) เป็นการวัดการกระจาย ของข้อมูลอย่างง่ายๆ เป็นค่าความแตกต่างของข้อมูล ที่มีค่าสูงสุด กับข้อมูลที่มีค่าที่สุด ดังนั้น จึงมีข้อเสีย คือ ใช้เฉพาะข้อมูลต่ำสุก และสูงสุดเท่านั้นไม่ได้ใช้ข้อมูลทั้งหมด
ข. ความแปรปรวน (Variance )
เป็นผลรวม ของกำลังสอง ของผล ต่างระหว่าง ค่าที่สังเกตกับค่ามัชฌิมเลขคณิต หาร ด้วย จำนวนที่สังเกตลบด้วย 1
Variance (S 2 ) = E (X1-X)2
N -1
= N EX2 - (E X) 2
N(n-1)
ค. ค่าเบี่ยงเบนมาตรฐาน (Standard deviation)
เป็นค่ารากกำลังสอง ของค่าความแปนปรวน ดังนั้น สูตรการคำนวณจึงใช้วิธีการเดียวกัน
ง. ความคลาดเคลื่อนมาตรฐาน (Standard error of the arithmetic mean ) ของค่ามัชฌิมเลขคณิต เป็นค่าเบี่ยยงเบนมาตรฐาน หารด้วย รากกำลังสองของจำนวนข้อมูลที่เราสังเกต
ความน่าจะเป็น
คำจำกัดความ ถ้าเราทำวีธีการใดวิธีการหนึ่ง ที่ให้ผลออกมาทั้งหมด เป็น n แล้วโอกาสที่จะเกิดเหตุการณ์ A เท่ากับ nA
ดังนั้น ความน่าจะเป็น ของ เหตุการณ์ A = nA/n
ยกตัวอย่าง เช่น เมื่อเราโยนเหรียญ หรือปั่นเหรียญอันหนึ่งลงบนพื้น
โอกาสที่จะออกหัว= 0.5
โอกาสที่จะออกก้อย = 0.5
ถ้าเราดึงไพ่ออกมาจากสำรับหนึ่ง ที่มี 52 ใบ
โอกาสที่จะได้ไพ่โพธิ์ดำ = 13/52 = 1/4 = 0.25
โอกาสที่จะได้ไพ่ A โพธิ์ดำ = 1/52
การทดสอบไค-สแควร์ (Chi-square test) X2
ในทางวิทยาการะบาด ค่าทางสถิติที่มีการใช้มากที่สุด คือ การทดสอบไค-สแควร์ ซึ่งโดยทั่วไปแล้ว เพื่อจุดประสงค์ดังต่อไปนี้
1.เพื่อทดลอง ว่าอัตราที่เราทดสอบมีความแตกต่าง อย่างมีนัยสำคัญ จากอัตราที่ตั้งไว้ใน สมมติฐานหรือไม่
2. เพื่อทดสอบว่าอัตรา 2 อัตรา มีความแตกต่างกันอย่างมีนัยสำคัญ หรือ ไม่
ไม่มีความเห็น