Probability density function, Survival function, Kaplan-Meier, Hazard function, Cox Proportional Hazards

กลุ่มอายุน้อยและกลุ่มอายุมากมีความเสี่ยงในการเสียชีวิตมากกว่ากลุ่มอายุช่วงกลางๆ (การกระจายข้อมูลไม่ได้เป็นแบบโค้งปกติ)

1) Probability density function

2) Survival function

3) Hazard function

วิเคราะห์ การป่วย การตาย (Event) และเวลา (Time)

Life Table (Graunt, 1662)

กลุ่มอายุน้อย และกลุ่มอายุมาก มีความเสี่ยงในการเสียชีวิตมากกว่ากลุ่มอายุช่วงกลางๆ
การกระจายของข้อมูลการเสียชีวิต ไม่ได้เป็นแบบโค้งปกติ (not normal distribution)

Source: http://www.stat.rice.edu/stat/FACULTY/courses/stat431/Graunt.pdf
2012-12-09


Probability density function = f(t)

ประชากร อายุ 70 ปีถึง 80 ปี เสียชีวิตมากที่สด (50%)
ถ้าอายุเกิน 80 ปี จะเหลือจำนวนประชากรน้อยลง

"People have a high chance of dying in their 70's and 80's; BUT they have a smaller chance of dying in their 90's and 100's, because few people make it long enough to die at these ages."

Source : Kristin Sainani. Introduction to Survival Analysis.
http://www.stanford.edu
2014-12-09


Survival function
Survival function = 1 - f(t)
การวัดการรอดชีพ (Survival) กลับทิศทางกับการวัดการตาย (Mortality, Died)
ถ้าการตายเพิ่มการรอดชีพลด ถ้าการตายลดการรอดชีพเพิ่ม ถ้าการตายคงที่การรอดชีพจะคงที่



Source : Kristin Sainani. Introduction to Survival Analysis.
http://www.stanford.edu
2014-12-09
ถ้าศึกษากลุ่มเดียวเป็น Discriptive Study ศึกษาการรอดชีพเทียบกับลำดับเวลา
ถ้าศึกษา 2 กลุ่มขึ้นไปเป็น Analytical Study เปรียบเทียบการรอดชีพแต่ละกลุ่ม
และปัจจัยที่เกี่ยวข้องเทียบกับลำดับเวลา

"ระยะเวลาตั้งแต่เริ่มรักษาถึงตายเรียกว่าระยะเวลาการรอดชีพ ระยะเวลาที่วัดได้เป็นข้อมูลต่อเนื่อง การแจกแจงเบ้ขวา แต่ไม่สามารถใช้วิธีการวิเคราะห์ ที่ใช้กับข้อมูลต่อเนื่องปกติ เช่น คำนวณหาค่ามัชฌิมมาใช้ในการวิเคราะห์ได้ ทั้งนั้เพราะการศึกษาจะมีการกำหนดระยะเวลาการศึกษาไว้ชัดเจน เช่น 3 ปี ในขณะที่วิเคราะห์เมื่อสิ้นสุดโครงการ ผู้ป่วยบางส่วนยังไม่ตาย และถ้าจะรอให้ตายก็ไม่รู้ว่าจะรออีกนานเท่าไร ค่าเฉลี่ยของระยะเวลาการรอดชีพคำนวณเมื่อสิ้นโครงการจึงทำไม่ได้ และในความเป็นจริงผู้ป่วยที่นำเข้าศึกษาในโครงการจะไม่สามารถเริ่มต้นในวันเดียวกันได้ ทั้งหมดจะต้องทะยอยเข้ามาในการศึกษา มำให้ในช่วงเวลาที่กำหนดผู้ป่วยแต่ละคนมีระยะเวลาที่เข้าร่วมไม่เท่ากันบางคนสั้นบางคนยาว"
ที่มา : อรุณ จิรวัฒนกุล ชีวสถิติสำหรับวิทยาศาสตร์สุขภาพ

Kaplan-Meier
Survival Analysis นับเวลาทีละคน และจัดเรียงใหม่ ให้เวลาตั้งต้นอยู่ที่เดียวกัน
ตัวแปร Censored เช่น ถอนตัวจากการศึกษา, การขาดหายไปจากการศึกษา,
การเสียชีวิตจากสาเหตุอื่น, หรือหายป่วย, ครบระยะเวลาการศึกษา (Administrative Censored)

Failure (died=1)
Censored (died=0)

อาจเรียกว่า "ระยะเวลาปลอดเหตุการณ์"
เวลาจริง (T) มากกว่า เวลา (t) ในสมการ (right censored)
Outcome แบบ Dichotomous
Predictor แบบ Dichotomous
เช่น ใช้เปรียบเทียบ การรักษาด้วยยาใหม่กับการรักษาด้วยยามาตรฐาน
Non-Parametric
เปรียบเทียบ Median ของ 2 กลุ่มด้วยวิธี Log-rank test

ทางการแพทย์ แสดงการรอดชีพหลังจากได้รับการรักษาช่วงระยะเวลาหนึ่ง
ทางเศรษฐศาสตร์ แสดงเวลาเริ่มจากที่ว่างงานจนถึงรับทำงานใหม่
ทางวิศวกรรม แสดงเวลาใช้งานชิ้นส่วนของเครื่องจักรจนถึงชิ้นส่วนนั้นชำรุด
ทางด้านสิ่งแวดล้อม แสดงเวลาที่ผลไม้ยังคงติดอยู่กับกิ่งโดยยังไม่ถูกกัดกินโดยสัตว์ที่กินผลไม้


Kaplan-Meier

"the two functions are somewhat closer together in the first few weeks of follow-up,
but thereafter are quite spread apart. This widening gap suggests that the treatment
is more effective later during follow-up than it is early on."
Source: D.G.Kleinbaum, Michel Klein. Statistics for Biology and Health.Survival Analysis.

ช่วงสัปดาห์แรกๆเส้นกราฟลดลงทิศทางเดียวกัน ใกล้ๆกัน
แต่ในภายหลังเส้นกราฟ 2 เส้น แยกจากกัน
ช่องว่างที่ห่างกัน หมายถึงการรักษาแบบหนึ่ง ดีกว่าอีกแบบหนึ่งในภายหลัง
โดยที่ในช่วงแรกๆไม่ต่างกันมาก

[ Link ]
https://dl.dropboxusercontent.com/u/1999671/EPI_56/survival/why_survival.htm



Hazard function = h(t)



Source : Kristin Sainani. Introduction to Survival Analysis
http://www.stanford.edu
2014-12-09

1. Exponential (Hazard is constant over time) หมายถึง Hazard คงที่
2. Weibull (Hazard increasing or decreasing over time)
2.1 Increasing Weibull เช่น การหายป่วยจากการผ่าตัด
2.2 Decreasing Weibull เช่น การเสียชีวิตจากโรคมะเร็งเม็ดเลือดขาว
3. Lognormal เช่น วัณโรค ระยะแรกเสียชีวืตมากต่อมาเสียชีวิตน้อยลง

Cox Proportional Hazards
Semi-parametric
Cox models the effect of
"predictors and covariates on the hazard rate
but leaves the baseline hazard rate unspecified."

Hazard Ratio
มีความหมายว่า กลุ่ม 2 เกิดเหตการณ์ เป็นจำนวนกี่เท่า
ของการเกิดเหตุการณ์ ของกลุ่ม 1 เช่น เดียวกับ Risk Ratio ของ Cohort study
หรือ Experimental Study วิเคราะห์ด้วยวิธี Cox Proportional Hazard
และ Adjusted ด้วย Covariate ได้
[ Link ]
https://www.gotoknow.org/posts/487453


ควรใช้วิธี Survival Analysis
เนื่องจากมีตัวแปร Censored (ขาดหายจากการศึกษา, ตายจากสาเหตุอื่น, หายป่วย, ... )
ถ้าหากวิเคราะห์ด้วยวิธี Logistic Regression
หรือวิธี เปรียบเทียบค่า mean ของระยะเวลา ถึง end point ของแต่ละคน
ผลที่คำนวณได้อาจจะทำให้เข้าใจผิด (mis-leading results)

ตัวอย่าง Survival Analysis จาก STATA




[ Link ]

https://dl.dropboxusercontent.com/u/1999671/EPI_56/survival/index.htm



บันทึกนี้เขียนที่ GotoKnow โดย  ใน EPISTAT



ความเห็น (0)