เรียนสถิติด้วยภาพ ตอนที่ 2 Confidence Interval, alpha level & Statistical difference


งานวิจัยที่ดี ควรแตกต่างทั้งทางสถิติ (ดู p-value) และแตกต่างทางปฎิบัติในชีวิตจริง (ใช้ดุลยพินิจของคนที่ทำงานสาขานั้น) จึงจะถือว่า แตกต่างอย่างมีคุณภาพ

(ต่อจาก เรียนสถิติด้วยภาพ ตอนที่ 1 Confidence Interval & alpha level )

เวลาเรามีข้อมูลดิบที่เขาบอกว่า เป็นข้อมูลธรรมดา ความหมายมักจะสื่อว่า การแจกแจงเป็นแบบที่เรียก การแจกแจงปรกติ (normal distribution) ดังรูปบน

รูปแรก บอกว่า ที่ศูนย์กลางเกิดบ่อยแค่ไหน ดูความถี่

รูปถัดมา เกิดให้ดูซะเลย ลงจุดบนเส้น

จะเห็นได้ว่า ลงจุดแบบนี้ ดูยาก

ผมก็เลยจับรูปที่สองมาหมุนรอบตัวเองแล้ว "ถ่ายรูป" เป็นระยะ เวลาซ้อนรูปถ่าย ผมก็จะเห็นเป็นรูปล่าง ที่กระจายเป็นวงกลม

http://cdn.gotoknow.org/assets/media/files/000/674/068/original_Gauss20110113.jpg?1294880690

เพราะฉะนั้น ข้อมูลหนึ่งชุด ก็จะเห็นหนึ่งหย่อม

ลองซูมดูให้ชัด ๆ จะเห็นอย่างนี้

Large_gauss2554wibul

มีโอกาสที่จุดข้อมูล จะอยู่ในกรอบ -1 ถึง +1 เท่ากับ 68.26895%

มีโอกาสที่จุดข้อมูล จะอยู่ในกรอบ -2 ถึง +2 เท่ากับ 95.44997%

มีโอกาสที่จุดข้อมูล จะอยู่ในกรอบ -3 ถึง +3 เท่ากับ 99.73002%

มีโอกาสที่จุดข้อมูล จะอยู่ในกรอบ -4 ถึง +4 เท่ากับ 99.99367%

มีโอกาสที่จุดข้อมูล จะอยู่ในกรอบ -5 ถึง +5 เท่ากับ 99.99994%

คราวนี้ลองดูข้อมูลดิบตั้งต้น ของข้อมูลสองหย่อม

ข้อมูลแสดงไว้ในที่นี้ แสดงผลเป็นภาพสองมิติ เพื่อให้ดูเข้าใจง่าย เพราะสมองของคนเรา ไม่ชินที่จะมองมิติเดียว เวลามอง สิ่งที่ควรสนใจคือ ระยะห่างจากจุดศูนย์กลางเพียงอย่างเดียว โดยผมสุ่มหมุนทิศไปเรื่อย ๆ ทำให้เห็นภาพชัดเจนขึ้น

Binarygalaxy100

เวลาดูข้อสรุปทางสถิติว่า ค่าเฉลี่ยต่างกันไหม เขาไม่ได้ดูข้อมูลดิบ แต่ดูค่าเฉลี่ยที่สุ่มได้มา

เวลาเราไปเก็บข้อมูลมาหนึ่งครั้ง ก็ได้ค่าเฉลี่ยมาค่าหนึ่ง

เก็บเป็นร้อยครั้ง ก็ได้ค่าเฉลี่ยเป็นร้อยค่า

ถ้าเปรียบเทียบค่าเฉลี่ย ก็ต้องเอาค่าเฉลี่ยที่ได้ (ซึ่งจะเป็นศูนย์กลางของหย่อมข้อมูลดิบอีกทีนึง) มาลงจุด ซึ่งก็จะเห็นคล้ายภาพข้างบนเหมือนกัน

ดังนั้น ต่อจากนี้ไป จะพูดถึงแต่ค่าเฉลี่ยนะครับ ว่าเก็บข้อมูลครั้งนึง ได้หนึ่งจุด

พล็อตค่าเฉลี่ย เห็นกระจายทำนองนี้แหละ

ถ้าเราเล็มขอบทิ้งไป alpha เหลือแกนกลางเป็น confidence interval เราก็จะเห็นส่วนที่เป็นแกนกลางที่ขอบคมกริบขึ้น เห็นข้อมูลสองหย่อมชัดเจน เพราะขีดตีวงไว้

สมมติว่า แต่ละหย่อม เล็มทิ้งไป 5 % (alpha level = 0.05) ทำให้แกนกลาง เหลือ 95 % ในกรณีนี้ เราจะเห็นว่า ข้อมูลสองหย่อมนี้ เกยกันอยู่

สถิติ มีศัพท์เรียกว่า "ไม่แตกต่างทางสถิติ ที่ alpha level = 0.05"

Binarygalaxy95

แต่เมื่อขยายค่า alpha ออกไปให้ใหญ่ขึ้น confidence interval แต่ละหย่อม ก็ค่อย ๆ หดตัวเล็กลง จนถึงจุดหนึ่ง ที่ขอบนอกของ confidence interval แตะกันพอดี

สมมติว่ากรณีนี้ เกิดการแตะกันพอดีที่ alpha = 0.07 ก็เรียกว่า p-value เป็น 0.07

Binarygalaxyatalphalavel

ลองดูภาพ animation อีกแบบก็ได้

Large_pvalueanim001

Large_pvalueanim002 Large_pvalueanim003

Large_pvalueanim004

Large_pvalueanim005

เราจะเห็นว่า เล็มไปที่ระดับ alpha = 0.17 จะทำให้ขอบในเริ่มขาดกัน ก็คือ p-value เป็น 0.17

ค่า alpha level ที่กรณีเฉพาะนี้ เรียกว่า p-value

อย่างไรก็ตาม ในทางปฎิบัติ เราไม่ได้เปรียบเทียบประชากรต่อประชากร แต่เปรียบเทียบ ค่าเฉลี่ย ต่อ ค่าเฉลี่ย

ดังนั้น สิ่งที่เราเห็นเป็นความฟุ้งรอบศูนย์กลาง จึงไม่ใช่ความฟุ้งของประชากร แต่เป็นความฟุ้งรอบค่าเฉลี่ย ซึ่งอธิบายโดย standard error of the mean ไม่ใช่ standard deviation (อ่านเรื่อง SE และ SD ในตอนถัด ๆ ไป)

ถ้าเราตั้งเป้าว่า เราจะเปรียบเทียบโดยใช้เกณฑ์ alpha เป็น 0.2

กรณีนี้ ก็จะสรุปว่า "แตกต่างกันทางสถิติอย่างมีนัยสำคัญ เพราะ p-value < alpha level"

แต่ถ้าเราตั้งเป้าว่า เราจะเปรียบเทียบโดยใช้เกณฑ์ alpha เป็น 0.05

กรณีนี้ ก็จะสรุปว่า "ไม่แตกต่างกันทางสถิติ เพราะ p-value > alpha level"

ถ้าดูให้ดี จะเห็นว่า ข้อมูลทั้งสองกอง ก็อยู่อย่างนั้นมาตลอด ไม่ได้เปลี่ยนแปลงอะไรเลย ที่เปลี่ยน คือ เกณฑ์ ว่าขนาดไหน ที่จะเรียกว่าต่าง (เกณฑ์ที่ว่า ก็คือ alpha level) แล้วก็ทำให้เราเห็นว่า ข้อมูลสองหย่อมนั้น ขาดออกมาจากกันไหม ถ้ามองว่าไม่ขาด ก็ไม่ต่างทางสถิติ ถ้ามองว่าขาด ก็จะต่างทางสถิติ

ดังนั้น การต่างหรือไม่ต่างทางสถิติ จึงเป็นสิ่งที่ต้องมีกรอบอ้างอิงเสมอ กรอบอ้างอิงนี้ ก็คือ alpha level หรือ confidence interval

ถ้าเห็น confidence interval ของข้อมูลสองกองเกยกันอยู่ เราก็บอกว่า สองกองนั้น ไม่ต่างกัน ที่ alpha นั้น ๆ

ถ้าเห็น confidence interval ของข้อมูลสองกอง แยกขาดออกจากกันได้ เราก็บอกว่า สองกองนั้น ต่างกัน ที่ alpha นั้น ๆ

ลองดูกรณีสมมติ ...ดูดาวคู่

p-value

กรณีแรก (ซ้ายสุด) ดูตอนฟ้ามัว เห็นแสงเป็นฝ้าเบลอ ๆ จนดูแล้วแยกไม่ค่อยออก เห็นราวเป็นดาวเดี่ยว กรณีนี้ ถ้าเปรียบเทียบระยะห่างระหว่างจุดศูนย์กลาง จะมี p-value สูง ทำให้ต้องสรุปว่า ไม่แตกต่างกันทางสถิติ (คนที่เรียนสถิติมาก็จะบอกว่า อ๋อ ก็ p-value สูงกว่า alpha นั่นไง มันจึงไม่แตกต่าง ก็คือภาพแรกนี้)

แต่พอท้องฟ้าเริ่มใสขึ้น ๆ สองหย่อมก็เริ่มสามารถมองเห็นขาดจากกันได้ชัดเจนขึ้นเรื่อย ๆ เกิดกรณีที่ แตกต่างกันอย่างมีนัยสำคัญ

แต่ประเด็นที่ต้องระลึกถึงคือ ระยะห่างทางกายภาพของดาวทั้งคู่ เหมือนเดิมทุกครั้ง แต่ก็อาจได้ข้อสรุปทางสถิติที่หลากหลาย ขึ้นกับคุณภาพข้อมูล ซึ่งในที่นี้ ก็คือ ความแปรปรวน หรือเทียบได้กับการที่ฟ้ามัวสลัวหม่น

พูดอีกนัยหนึ่ง แตกต่างทางสถิติ อาจไม่ได้บอกอะไรเลยว่า แตกต่างทางกายภาพไหม !

พวกงานวิจัยมั่วนิ่มจำนวนมาก ชอบเอาช่องโหว่ตรงนี้แหละมาใช้ เช่น บอกว่า ยานี้ลดความดันดีกว่ากลุ่มยาหลอกได้ดีอย่างมีนัยสำคัญยิ่งทางสถิติ แต่อ้อมแอ้มเลี่ยงไปว่า ที่ต่างน่ะ แค่ 10 mmHg ซึ่งจิ๊บจ๊อยมาก ซึ่งงานวิจัยที่ดี ควรแตกต่างทั้งทางสถิติ และแตกต่างทางปฎิบัติในชีวิตจริง จึงจะถือว่า แตกต่างอย่างมีคุณภาพ


สนใจอ่าน เรียนสถิติด้วยภาพ แบบครบทุกตอน เข้าไปที่

http://www.gotoknow.org/posts?tag=เรียนสถิติด้วยภาพ<p></p>

หมายเลขบันทึก: 214513เขียนเมื่อ 6 ตุลาคม 2008 23:58 น. ()แก้ไขเมื่อ 28 มีนาคม 2016 09:05 น. ()สัญญาอนุญาต: สงวนสิทธิ์ทุกประการจำนวนที่อ่านจำนวนที่อ่าน:


ความเห็น (15)

เริ่มเห็นภาพครับ

ข้อมูลมันก็อยู่ของมันอย่างนั้น แต่เราไปนิยามมันว่าต้องกำหนดค่า alpha เท่าไร

ความแตกต่างจึงเกิดจาก การกำหนดค่า confidence interval

ขอบคุณครับ อ.

เริ่มเข้าใจมากขึ้นคะ

ขอบคุณคะ

  • อ่านประเด็นไหนแล้วงง ช่วยบอกด้วยนะครับ เพราะเนื้อหาตรงนี้ เป็นจุดตั้งต้นของอีกหลายเรื่องที่จะตามมา
  • มีบางประเด็นที่คิด ๆ ว่ามันต่อกับเนื้อหาตรงนี้ แต่ยังนึกรูปไม่ออก
  • ระหว่างนี้ หากอ่านแล้วมีประเด็นไหนที่อยากให้ผมยกมาพูด และเนื้อหาเกี่ยวกับพวกนี้ ช่วยหมายเหตุไว้นะครับ ผมยังคิดจะเรียบเรียงต่อ

ขอยืนยันการติดตามอ่านต่อครับ

ขอบคุณครับ

หนูอ่านมาหลายหัวข้อแล้วค่ะ ชอบทุกหัวข้อเรย เข้าจัยง่ายดี

หนูคงจะสอบnational boardหัวข้อผ่านเพราะอาจานแน่ๆๆ

ขอบคุนมากค่ะ

อธิบายเข้าใจง่ายดีมากครับ

แต่ผมยังตามไม่ทันที่ภาพสุดท้าย เรื่อง Null hyprothesis

ไม่ทราบว่า การจะให้คำว่า Reject หรือ Accept ขึ้นอยู่กับ คำถาม No statistical difference , Significant , ... หรือไม่ครับ ?

ไม่เข้าใน คำศัพท์ภาษาอังกฤษในย่อหน้าสุดท้ายนะครับ

เป็นเว็บที่ดีมากจริงๆ

สุดยอดเลยค่ะอาจารย์ ถึงบางอ้อ


รูปภาพหายไป ขอช่วยลงใหม่ให้ได้ไหมครับกราบบบ

พบปัญหาการใช้งานกรุณาแจ้ง LINE ID @gotoknow
ClassStart
ระบบจัดการการเรียนการสอนผ่านอินเทอร์เน็ต
ทั้งเว็บทั้งแอปใช้งานฟรี
ClassStart Books
โครงการหนังสือจากคลาสสตาร์ท