ForensicStatistics4: หลุมพราง ของการใช้ Posterior probability


นั่นเป็นที่มาของการที่ต้องมาพิจารณา ประโยคที่ใช้ในการรายงานผล ซึ่งนำมาสู่การเปลี่ยนแปลงข้อความในใบรายงานผลด้านการตรวจความสัมพันธ์พ่อ-ลูก และแม่-ลูก เป็น "ความเชื่อมั่นที่นาย ก เป็นพ่อของเด็กชาย ข เท่ากับร้อยละ xx.xxxxxxxx"

     เมื่อเราได้ทำความรู้จักกับค่าทางสถิติที่ใช้ในงานตรวจพิสูจน์ดีเอ็นเอไปครบทั้งสามตัวแล้ว จะเห็นได้ว่า ค่าทางสถิติแต่ละตัว มันมีที่มา มีรูปแบบของการใช้อธิบาย และมีข้อจำกัดในการใช้อธิบายผลอยู่พอสมควร ซึ่งเวลาถูกนำมาใช้อธิบายผลการทดสอบด้านการตรวจพิสูจน์ดีเอ็นเอ โดยเฉพาะอย่างยิ่งในชั้นศาลยุติธรรมแล้ว บางครั้งเราก็ใช้กันถูก บางครั้งเราก็ใช้กันผิด ทำให้ทั้งผู้ฟัง หรือบางครั้งต้องแถมตัวเราเข้าไปด้วย งง! กันไปหมด ทั้งคนพูด คนฟัง 

     เริ่มต้นที่นี่ก็แล้วกัน

     ย้อนอดีตไปสักหนึ่งปีที่ผ่านมา รายงานการตรวจพ่อ-ลูก หรือ แม่-ลูก ของหน่วยนิติเวชศาสตร์และพิษวิทยา หากผลการตรวจเข้ากันได้ และคำนวณค่า posterior probability สมมติว่า ได้ 99.99000000% เราใช้คำว่า "โอกาสที่นาย ก เป็นพ่อของ เด็กชาย ข เท่ากับ ร้อยละ 99.99000000"  แล้วใช้อย่างนี้มาหลายปีเสียด้วย ไม่อยากจะบอกว่าใช้มาตั้งแต่เราเริ่มต้นทำงานตรวจพิสูจน์ดีเอ็นเอเลยก็ว่าได้  แล้วอยู่มาวันหนึ่ง ในงานประชุมเชิงปฏิบัติการแพทย์นิติเวชที่ปฏิบัติงานในจังหวัดชายแดนภาคใต้ มีท่านอัยการ ศักดิ์ชัย  อัศวินอานันท์ ท่านเป็นรองอธิบดีอัยการฝ่ายคดีแรงงาน เขต 9 ได้ทักว่า หากเราใช้คำว่า โอกาสที่นาย ก เป็นพ่อของเด็กชาย ข จะเป็นร้อยละเท่าไรก็ตาม ซึ่งไม่ครบร้อยอยู่แล้วล่ะ ในอีกมุมหนึ่ง มันจะมีคำว่า โอกาสที่นาย ก ไม่ได้เป็นพ่อของเด็กชาย ข จะเป็นร้อยละศูนย์จุดศูนย์ศูนย์ตามด้วยตัวเลขอะไรก็ตาม ในทางด้านกระบวนการยุติธรรม เป็นเรื่องที่ทนายความจะต้องนำสืบให้ผู้พิพากษาเห็นด้วย และคล้อยตามในพยานหลักฐาน จนเชื่อโดยสนิทใจว่า นาย ก เป็น พ่อของ เด็กชาย ข จริง โดยไม่มีข้อกังขา แต่เมื่อวิธีการนำเสนอของเรา บอกว่า โอกาสที่นาย ก จะเป็นพ่อของเด็กชาย ข มีค่าไม่เต็มร้อย หรือยังมีข้อที่ทำให้ศาลเห็นว่า ยังมีโอกาสที่นาย ก จะไม่ใช่พ่อของเด็กชาย ข ได้ ทำให้อาจเป็นข้อโต้แย้งได้ ซึ่งในด้านยุติธรรม หากไม่สามารถทำให้ศาลเชื่อได้ปราศจากข้อสงสัยได้ ก็เป็นเรื่องที่ต้องยกประโยชน์ให้จำเลย

     นั่นเป็นที่มาของการที่ต้องมาพิจารณา ประโยคที่ใช้ในการรายงานผล ซึ่งนำมาสู่การเปลี่ยนแปลงข้อความในใบรายงานผลด้านการตรวจความสัมพันธ์พ่อ-ลูก และแม่-ลูก เป็น "ความเชื่อมั่นที่นาย ก เป็นพ่อของเด็กชาย ข เท่ากับร้อยละ xx.xxxxxxxx"

     ตัวอย่างที่สอง

     ผลการตรวจดีเอ็นเอเปรียบเทียบระหว่าง นาย ก กับเด็กชาย ข เข้ากันได้ทุกตำแหน่ง โดยคำนวณได้ LR = 10,000 ; Posterior prob = 99.99000000% 

     เราบอกว่า จากค่า LR มีค่าเท่ากับ 10,000 หมายความว่า โอกาสที่นาย ก จะเป็นพ่อของเด็กชาย ข เท่ากับ 10,000 เท่าของโอกาสที่บุคคลอื่นจะเป็นพ่อของเด็กชาย ข  คำพูดนี้ยังถูกต้องอยู่นะครับ เพราะเป็นความหมายของคำว่า likelihood ratio  ทีนี้ในทุกคนอื่น 10,000 คน จะมีคนที่มีรูปแบบดีเอ็นเอเป็นแบบนาย ก 1 คน  แล้วประโยคต่อมา เขาบอกว่า ประเทศไทยมีประชากรประมาณ 70 ล้านคน เอา 10,000 ไปหาร จะได้  7,000 คน นั่นหมายความว่า ในประเทศไทยมีคนที่อาจเป็นพ่อของเด็กชาย ข 7,000 คน

     มึนมั้ยล่ะ

     แต่บอกได้เลยครับ ว่าผิดครับ มันจะไม่ผิดได้อย่างไร มันผิดตั้งแต่ เอา 10,000 ไปหารแล้วครับ จำได้ไหมครับ จากบันทึกก่อนหน้านี้ที่บอกว่า posterior prob มันมีเบื้องหลังที่ต้องระวังอยู่ 2 ประการ แล้วประการที่สองของเบื้องหลังนี้คือ มันซ่อนอยู่ในค่า likelihood ratio เวลาเราพูดถึง likelihood ratio เรามักบอกว่า โอกาสที่นาย ก เป็น พ่อของเด็กชาย ข เท่ากับ 10,000 เท่าของคนทั่วไปที่ไม่มีความสัมพันธ์เป็นญาติกัน แต่คำว่า คนทั่วไปที่ไม่มีความสัมพันธ์เป็นญาติกัน หากเราไปดูในรายละเอียดของการคำนวณค่า paternity index เช่นที่ตำแหน่งใดตำแหน่งหนึ่ง ผมยกตัวอย่างว่า ได้สูตรคำนวณเป็น 1/F(12) เวลาคำนวณเราก็ไปเปิดค่าความถี่อัลลีลที่ 12 ของตำแหน่งนั้น แล้วเอาไปหาร 1 ก็จะได้เป็น paternity index  ซึ่งมีค่าเท่ากับ Likelihood ratio  เมื่อย้อนกลับไปดูที่สูตร เราจะเจอว่าในสูตรนี้ เป็นการคัดเลือกเฉพาะคนที่มีค่าอัลลีลเท่ากับ 12 เท่านั้น คนที่มีรูปแบบดีเอ็นเอไม่ใช่ 12 ถูกคัดทิ้งหมด ไม่ได้ถูกนำมาคำนวณด้วย เพราะฉะนั้น คำว่าคนทั่วไปที่ไม่มีความสัมพันธ์เป็นญาติกัน ถ้าจะให้ถูกต้อง ก็ต้องบอกว่า คนทั่วไปที่ไม่มีความสัมพันธ์เป็นญาติกันแล้วมีรูปแบบดีเอ็นเอเข้ากันได้กับเด็กเท่านั้น ส่วนคนที่มีรูปแบบดีเอ็นเอเข้ากันไม่ได้ ก็ถูกคัดทิ้งไปตั้งแต่ต้นแล้ว เพราะฉะนั้น ในประชากร 70 ล้านคน จะต้องถูกแยกออกเป็น สองกลุ่ม คือ กลุ่มคนที่มีรูปแบบดีเอ็นเอที่เข้าไม่ได้กับเด็ก หรือปฏิเสธการเป็นพ่อ-ลูกกับเด็กคนนี้ ซึ่งเป็นกลุ่มคนส่วนใหญ่ กับกลุ่มคนที่มีรูปแบบดีเอ็นเอเข้าได้กับเด็กซึ่งไม่สามารถปฏิเสธการเป็นพ่อ-ลูกกับเด็กคนนี้ได้ ซึ่งเป็นส่วนน้อย (ไม่ได้บอกว่ารูปแบบดีเอ็นเอเหมือนกับนาย ก นะครับ) ซึ่งส่วนน้อยนี้มีค่าเท่าไหร่ เรายังไม่รู้แน่ชัด ถ้าต้องการรู้ก็ต้องไปคำนวณทางสถิติต่อไป แล้วทีนี้ในคนกลุ่มน้อยนี่แหละ ที่บอกว่า โอกาสที่นายก จะเป็นพ่อของเด็ก เป็น 10,000 เท่าของคนกลุ่มน้อยนี้ เห็นไหมว่า มันซับซ้อนเพิ่มขึ้นเรื่อยๆ  พอก่อนดีกว่า ก่อนที่จะงงกันไปมากกว่านี้ 

 

หมายเลขบันทึก: 478787เขียนเมื่อ 15 กุมภาพันธ์ 2012 12:32 น. ()แก้ไขเมื่อ 21 มิถุนายน 2012 12:26 น. ()สัญญาอนุญาต: ครีเอทีฟคอมมอนส์แบบ แสดงที่มา-ไม่ใช้เพื่อการค้า-อนุญาตแบบเดียวกันจำนวนที่อ่านจำนวนที่อ่าน:


ความเห็น (10)

พ่อหมูอ้วน เพื่อนรัก

ฉันว่าทั้งเรื่อง DNA และเรื่องสถิติที่พ่อเล่าเป็นเรื่องยากทั้งคู่เลยนิ... และสถิติก็ยังคงเป็นยาขมสำหรับฉันเหมือนเดิมจ้า...

แต่ที่เก่งมากที่สุดคือเพื่อนฉัน..ที่พยายามนำเรื่องยากที่สุดทั้งสองเรื่องมาถ่ายทอด...

สุดดด...ยอดดดด....จ้า เพื่อนฉัน

พี่โอ๋

พี่โอ๋งง เป็นเรื่องธรรมชาติครับ เพราะบางครั้งผมก็งงเหมือนกัน

แม่แมงมุม เพื่อนรัก

ทั้งเรื่อง ดีเอ็นเอ ทั้งเรื่องสถิติ เป็นเรื่องยากจ้า แต่ก็ไม่ยากเกินกว่าที่พวกเราทุกคนจะเข้าใจได้หรอกจ้า แค่นั่งลง แล้วอ่านเยอะๆ ถามเยอะๆ สักพักมันก็จะเป็นพวกเดียวกะเรา คุยภาษาเดียวกัน ไปไหนไปด้วยกัน ไม่แปลกแยกจากเราอีกจ้า แม่แมงมุมก็พิสูจน์มาแล้่วนี่นา ว่าการทำวิจัยไม่ใช่เรื่องยากเกินกว่าที่แม่แมงมุมจะทำได้ .....จริงมั้ย

พ่อหมูอ้วน เพื่อนรัก

ประสบการณ์การทำวิจัยครั้งนั้นของฉันมันบอกได้แต่เพียงว่า ฉันพอทำได้จ้า ฉันโชคดีที่มีพี่เลี้ยงที่ดีเลยทำให้งานสำเร็จได้... งานวิจัยทำให้ความคิดของฉันคมขึ้น ฉันสนุก ยกเว้นส่วนสถิติที่ยังไงมันก็ยังเป็นยาขมอยู่ดีจ้า

ขอบคุณค่ะที่ยังคอยเป็นกำลังใจให้ฉันเสมอ

แม่แมงมุม

ลองอีกสักเรื่องสิ แล้วจะติดใจ

พ่อหมูอ้วน

เพื่อนพี่เลี้ยงฉัน...ไม่เข็ด

น่านไง....แม่แมงมุม....เริ่มติดใจแล้วใช่ไหมล่ะ

ฉันไม่ได้บอกว่า...ติดใจจ้า...

แต่ฉันบอกว่า... "เพื่อนของฉัน...ไม่เข็ด ที่มีฉันเป็นเพื่อน ที่ต้องเลี้ยงอยู่เรื่อยๆ"จ้า... อิอิ

พ่อหมูอ้วน เพื่อนรัก

ฉันไม่อยากบอกพ่อเลยว่า... ความที่ฉันไม่เข็ด ฉันมีงานดีอีกเรื่องแล้วแหละ แล้วจะเล่าให้ฟังน้า ...

พบปัญหาการใช้งานกรุณาแจ้ง LINE ID @gotoknow
ClassStart
ระบบจัดการการเรียนการสอนผ่านอินเทอร์เน็ต
ทั้งเว็บทั้งแอปใช้งานฟรี
ClassStart Books
โครงการหนังสือจากคลาสสตาร์ท