เรียนสถิติด้วยภาพ ตอนที่ 2 Confidence Interval, alpha level & Statistical difference

(ต่อจาก เรียนสถิติด้วยภาพ ตอนที่ 1 Confidence Interval & alpha level )

เวลาเรามีข้อมูลดิบที่เขาบอกว่า เป็นข้อมูลธรรมดา ความหมายมักจะสื่อว่า การแจกแจงเป็นแบบที่เรียก การแจกแจงปรกติ (normal distribution) ดังรูปบน

รูปแรก บอกว่า ที่ศูนย์กลางเกิดบ่อยแค่ไหน ดูความถี่

รูปถัดมา เกิดให้ดูซะเลย ลงจุดบนเส้น

จะเห็นได้ว่า ลงจุดแบบนี้ ดูยาก

ผมก็เลยจับรูปที่สองมาหมุนรอบตัวเองแล้ว "ถ่ายรูป" เป็นระยะ เวลาซ้อนรูปถ่าย ผมก็จะเห็นเป็นรูปล่าง ที่กระจายเป็นวงกลม

เพราะฉะนั้น ข้อมูลหนึ่งชุด ก็จะเห็นหนึ่งหย่อม

ลองซูมดูให้ชัด ๆ จะเห็นอย่างนี้

มีโอกาสที่จุดข้อมูล จะอยู่ในกรอบ -1 ถึง +1 เท่ากับ 68.26895%

มีโอกาสที่จุดข้อมูล จะอยู่ในกรอบ -2 ถึง +2 เท่ากับ 95.44997%

มีโอกาสที่จุดข้อมูล จะอยู่ในกรอบ -3 ถึง +3 เท่ากับ 99.73002%

มีโอกาสที่จุดข้อมูล จะอยู่ในกรอบ -4 ถึง +4 เท่ากับ 99.99367%

มีโอกาสที่จุดข้อมูล จะอยู่ในกรอบ -5 ถึง +5 เท่ากับ 99.99994%

คราวนี้ลองดูข้อมูลดิบตั้งต้น ของข้อมูลสองหย่อม

ข้อมูลแสดงไว้ในที่นี้ แสดงผลเป็นภาพสองมิติ เพื่อให้ดูเข้าใจง่าย เพราะสมองของคนเรา ไม่ชินที่จะมองมิติเดียว เวลามอง สิ่งที่ควรสนใจคือ ระยะห่างจากจุดศูนย์กลางเพียงอย่างเดียว โดยผมสุ่มหมุนทิศไปเรื่อย ๆ ทำให้เห็นภาพชัดเจนขึ้น

เวลาดูข้อสรุปทางสถิติว่า ค่าเฉลี่ยต่างกันไหม เขาไม่ได้ดูข้อมูลดิบ แต่ดูค่าเฉลี่ยที่สุ่มได้มา

เวลาเราไปเก็บข้อมูลมาหนึ่งครั้ง ก็ได้ค่าเฉลี่ยมาค่าหนึ่ง

เก็บเป็นร้อยครั้ง ก็ได้ค่าเฉลี่ยเป็นร้อยค่า

ถ้าเปรียบเทียบค่าเฉลี่ย ก็ต้องเอาค่าเฉลี่ยที่ได้ (ซึ่งจะเป็นศูนย์กลางของหย่อมข้อมูลดิบอีกทีนึง) มาลงจุด ซึ่งก็จะเห็นคล้ายภาพข้างบนเหมือนกัน

ดังนั้น ต่อจากนี้ไป จะพูดถึงแต่ค่าเฉลี่ยนะครับ ว่าเก็บข้อมูลครั้งนึง ได้หนึ่งจุด

พล็อตค่าเฉลี่ย เห็นกระจายทำนองนี้แหละ

ถ้าเราเล็มขอบทิ้งไป alpha เหลือแกนกลางเป็น confidence interval เราก็จะเห็นส่วนที่เป็นแกนกลางที่ขอบคมกริบขึ้น เห็นข้อมูลสองหย่อมชัดเจน เพราะขีดตีวงไว้

สมมติว่า แต่ละหย่อม เล็มทิ้งไป 5 % (alpha level = 0.05) ทำให้แกนกลาง เหลือ 95 % ในกรณีนี้ เราจะเห็นว่า ข้อมูลสองหย่อมนี้ เกยกันอยู่

สถิติ มีศัพท์เรียกว่า "ไม่แตกต่างทางสถิติ ที่ alpha level = 0.05"

แต่เมื่อขยายค่า alpha ออกไปให้ใหญ่ขึ้น confidence interval แต่ละหย่อม ก็ค่อย ๆ หดตัวเล็กลง จนถึงจุดหนึ่ง ที่ขอบนอกของ confidence interval แตะกันพอดี

สมมติว่ากรณีนี้ เกิดการแตะกันพอดีที่ alpha = 0.07 ก็เรียกว่า p-value เป็น 0.07

ลองดูภาพ animation อีกแบบก็ได้

เราจะเห็นว่า เล็มไปที่ระดับ alpha = 0.17 จะทำให้ขอบในเริ่มขาดกัน ก็คือ p-value เป็น 0.17

ค่า alpha level ที่กรณีเฉพาะนี้ เรียกว่า p-value

อย่างไรก็ตาม ในทางปฎิบัติ เราไม่ได้เปรียบเทียบประชากรต่อประชากร แต่เปรียบเทียบ ค่าเฉลี่ย ต่อ ค่าเฉลี่ย

ดังนั้น สิ่งที่เราเห็นเป็นความฟุ้งรอบศูนย์กลาง จึงไม่ใช่ความฟุ้งของประชากร แต่เป็นความฟุ้งรอบค่าเฉลี่ย ซึ่งอธิบายโดย standard error of the mean ไม่ใช่ standard deviation (อ่านเรื่อง SE และ SD ในตอนถัด ๆ ไป)

ถ้าเราตั้งเป้าว่า เราจะเปรียบเทียบโดยใช้เกณฑ์ alpha เป็น 0.2

กรณีนี้ ก็จะสรุปว่า "แตกต่างกันทางสถิติอย่างมีนัยสำคัญ เพราะ p-value < alpha level"

แต่ถ้าเราตั้งเป้าว่า เราจะเปรียบเทียบโดยใช้เกณฑ์ alpha เป็น 0.05

กรณีนี้ ก็จะสรุปว่า "ไม่แตกต่างกันทางสถิติ เพราะ p-value > alpha level"

ถ้าดูให้ดี จะเห็นว่า ข้อมูลทั้งสองกอง ก็อยู่อย่างนั้นมาตลอด ไม่ได้เปลี่ยนแปลงอะไรเลย ที่เปลี่ยน คือ เกณฑ์ ว่าขนาดไหน ที่จะเรียกว่าต่าง (เกณฑ์ที่ว่า ก็คือ alpha level) แล้วก็ทำให้เราเห็นว่า ข้อมูลสองหย่อมนั้น ขาดออกมาจากกันไหม ถ้ามองว่าไม่ขาด ก็ไม่ต่างทางสถิติ ถ้ามองว่าขาด ก็จะต่างทางสถิติ

ดังนั้น การต่างหรือไม่ต่างทางสถิติ จึงเป็นสิ่งที่ต้องมีกรอบอ้างอิงเสมอ กรอบอ้างอิงนี้ ก็คือ alpha level หรือ confidence interval

ถ้าเห็น confidence interval ของข้อมูลสองกองเกยกันอยู่ เราก็บอกว่า สองกองนั้น ไม่ต่างกัน ที่ alpha นั้น ๆ

ถ้าเห็น confidence interval ของข้อมูลสองกอง แยกขาดออกจากกันได้ เราก็บอกว่า สองกองนั้น ต่างกัน ที่ alpha นั้น ๆ

ลองดูกรณีสมมติ ...ดูดาวคู่

p-value

กรณีแรก (ซ้ายสุด) ดูตอนฟ้ามัว เห็นแสงเป็นฝ้าเบลอ ๆ จนดูแล้วแยกไม่ค่อยออก เห็นราวเป็นดาวเดี่ยว กรณีนี้ ถ้าเปรียบเทียบระยะห่างระหว่างจุดศูนย์กลาง จะมี p-value สูง ทำให้ต้องสรุปว่า ไม่แตกต่างกันทางสถิติ (คนที่เรียนสถิติมาก็จะบอกว่า อ๋อ ก็ p-value สูงกว่า alpha นั่นไง มันจึงไม่แตกต่าง ก็คือภาพแรกนี้)

แต่พอท้องฟ้าเริ่มใสขึ้น ๆ สองหย่อมก็เริ่มสามารถมองเห็นขาดจากกันได้ชัดเจนขึ้นเรื่อย ๆ เกิดกรณีที่ แตกต่างกันอย่างมีนัยสำคัญ

แต่ประเด็นที่ต้องระลึกถึงคือ ระยะห่างทางกายภาพของดาวทั้งคู่ เหมือนเดิมทุกครั้ง แต่ก็อาจได้ข้อสรุปทางสถิติที่หลากหลาย ขึ้นกับคุณภาพข้อมูล ซึ่งในที่นี้ ก็คือ ความแปรปรวน หรือเทียบได้กับการที่ฟ้ามัวสลัวหม่น

พูดอีกนัยหนึ่ง แตกต่างทางสถิติ อาจไม่ได้บอกอะไรเลยว่า แตกต่างทางกายภาพไหม !

พวกงานวิจัยมั่วนิ่มจำนวนมาก ชอบเอาช่องโหว่ตรงนี้แหละมาใช้ เช่น บอกว่า ยานี้ลดความดันดีกว่ากลุ่มยาหลอกได้ดีอย่างมีนัยสำคัญยิ่งทางสถิติ แต่อ้อมแอ้มเลี่ยงไปว่า ที่ต่างน่ะ แค่ 10 mmHg ซึ่งจิ๊บจ๊อยมาก ซึ่งงานวิจัยที่ดี ควรแตกต่างทั้งทางสถิติ และแตกต่างทางปฎิบัติในชีวิตจริง จึงจะถือว่า แตกต่างอย่างมีคุณภาพ

สนใจอ่าน เรียนสถิติด้วยภาพ แบบครบทุกตอน เข้าไปที่

http://www.gotoknow.org/posts?tag=เรียนสถิติด้วยภาพ<p></p>

อ่านประเด็นไหนแล้วงง ช่วยบอกด้วยนะครับ เพราะเนื้อหาตรงนี้ เป็นจุดตั้งต้นของอีกหลายเรื่องที่จะตามมา
มีบางประเด็นที่คิด ๆ ว่ามันต่อกับเนื้อหาตรงนี้ แต่ยังนึกรูปไม่ออก
ระหว่างนี้ หากอ่านแล้วมีประเด็นไหนที่อยากให้ผมยกมาพูด และเนื้อหาเกี่ยวกับพวกนี้ ช่วยหมายเหตุไว้นะครับ ผมยังคิดจะเรียบเรียงต่อ

Nat_Panik

เขียนเมื่อ 7 ต.ค. 2551 00:04 น. 7 ต.ค. 2551

เริ่มเห็นภาพครับ

ข้อมูลมันก็อยู่ของมันอย่างนั้น แต่เราไปนิยามมันว่าต้องกำหนดค่า alpha เท่าไร

ความแตกต่างจึงเกิดจาก การกำหนดค่า confidence interval

ขอบคุณครับ อ.

สี่ซี่

เขียนเมื่อ 7 ต.ค. 2551 15:03 น. 7 ต.ค. 2551

เริ่มเข้าใจมากขึ้นคะ

ขอบคุณคะ

ภูสุภา

เขียนเมื่อ 7 ต.ค. 2551 21:21 น. 7 ต.ค. 2551