Statistics may be defined as "a body of methods for making wise decisions in the face of uncertainty." ~W.A. Wallis

การทดสอบแบบสุ่ม (Random experiment)

หมายถึงกระบวนการ หรือการกระทำที่ไม่อันก่อให้เกิดผลลัพธ์ที่สามารถชี้ชัดได้ และเมื่อทำการทดสอบเดิมใหม่อีกครั้ง ก็ไม่แน่ว่าจะได้ผลลัพธ์เดิม

ปัจจัยที่ก่อให้เกิดผลลัพธ์ที่แตกต่างกันนี้สามารถเป็นไปได้หลายทาง เช่น เราอาจจะทำการทดลองแบบเดียวกันนี้ บนวัสดุอุปกรณ์คนละชนิด หรือไม่ก็เครื่องมือวัดอาจจะมีค่า error ที่เกิดขึ้นได้ ฯลฯ

ยกตัวอย่างจากงานที่ทำ

อย่างเช่น ทดสอบความผิดเพี้ยนของดนตรี ว่าถ้าความถี่มีความผิดเพี้ยนเป็นปริมาณอย่างน้อยที่สุดเท่าไหร่ ผู้ถูกทดสอบถึงจะเริ่มจับความผิดเพี้ยนนี้ได้

ซึ่งปัจจัยที่มีผลต่อการทดลองนี้ นอกเหนือไปจากเพศ และวัย ของผู้ถูกทดสอบแล้ว อารมณ์และการฝึกฝนจากผู้ถูกทดสอบคนเดียวกัน ก็ทำให้ผลลัพธ์แตกต่างกันได้

(ชัดๆ คือ ถ้าเพิ่งถูกเจ้านายด่ามาหมาดๆ แล้วมาทดสอบ มักจะจับไม่ค่อยได้ว่าเสียงดนตรีเพี้ยน เพราะมีแต่เสียงด่าเจ้านายก้องอยู่ในโสตประสาท)

ความสามารถในการจำลองสถานการณ์์และวิเคราะห์ผลลัพธ์ออกมาได้จากการทดสอบสุ่มในท้ายที่สุดนั่นเอง คือ หัวใจของวิชาสถิติ

sample space ง่า.. (อันนี้ข้าพเจ้าก็ไม่รู้ว่าภาษาไทยเค้าใช้คำว่าอะไรอ่ะค่ะ ใครทราบก็ช่วยคอมเมนต์ไว้เป็นวิทยาทานด้วย)

หมายถึง ผลลัพธ์ที่จะเป็นไปได้ทั้งหมดจากการทดลอง เช่น ถ้าเราเล่นเกมปั่นเหรียญ sample space ก็คือ {หัว ก้อย} หรือถ้าเราทอยลูกเต๋า sample space ของหน้าลูกเต๋าก็คือ {1 2 3 4 5 6}

ความน่าจะเป็น (Prabability)
หมายถึงความเป็นไปได้ที่เหตุการณ์หนึ่งๆ จะเกิดขึ้น ค่าความน่าจะเป็นมักจะกำหนดให้อยู่ในช่วงตั้งแต่ 0 ถึง 1 โดยใช้สัญลักษณ์แทนความน่าจะเป็น (P- Probability) ต่อเหตุการณ์ (E- Event) ด้วย P(E)

ความน่าจะเป็นนั้นยังแบ่งออกได้เป็นสองลักษณะคือ
1. ความน่าจะเป็นในเหตุการณ์ที่เท่าเทียมกัน (Equal likelihood model) เช่นการปั่นเหรียญ โอกาสที่ผลลัพธ์ออกมาเป็นหัว หรือ ก้อย นั้นมีความน่าจะเป็นเท่ากันคือ 0.5
2. ความน่าจะเป็นในเหตุการณ์ที่มีความถี่สัมพันธ์ (Relative Frequency Method) นั่นคือ ความน่าจะเป็นที่จะเกิดแต่ละเหตุการณ์ขึ้นไม่เท่ากัน ขึ้นอยู่กับปัจจัยหนึ่งๆ ขณะนั้น ยกตัวอย่างเช่น ความสูงของนักเรียนในห้องป.1 ข. ที่นักเรียนส่วนมากของห้องมีความสูงอยู่ในช่วง 110 - 120 cm มีจำนวนน้อยที่เตี้ยกว่านั้น หรือสูงกว่านั้น

นอกจากนั้นแล้ว มีเทอมสองเทอมที่จำเป็นต้องรู้ไว้ (ขอใช้เป็นภาษาอังกฤษแบบไม่แปลแล้วกันค่ะ เพราะจากที่อ . บัญชาค้นคำแปลไทยมาให้ ยิ่งทำให้งง) และจะมีการอ้างถึงต่อไปในตัวอย่าง นั่นคือ
1. PDF (Probability Density Function)
2. CDF (Culmulative Distribution Function)

ยกตัวอย่างเพื่อใช้อธิบายสองเทอมนี้ น่าจะง่ายที่สุด

สมมุติว่าเราทำการจับสลากตัวเลขขึ้นมาตัวนึง โดยสลากนี้มีจำนวน 10 เบอร์ ตั้งแต่ 1 ถึง 10

เมื่อเราจับสลากขึ้นมาครั้งหนึ่ง บันทึกตัวเลขไว้ แล้วใส่คืนกลับไปที่กองเพื่อจับใหม่ เป็นจำนวนประมาณหนึ่ง เราก็นำค่าตัวเลข กับจำนวนครั้งที่สุ่มขึ้นมาได้มาพล็อตเป็นกราฟ

ถ้าเราคำนวณพื้นที่ใต้กราฟทั้งหมด นั่นคือ จำนวนครั้งที่เราหยิบสลาก

สมมุติว่าเราอยากรู้ว่า มีความเป็นไปได้เท่าไหร่ที่เราจะหยิบตัวเลยได้มีค่าจาก 3 ถึง 7
เราก็คำนวณจากพื้นที่ใต้กราฟของเรา (นับจำนวนครั้ง) ที่เราจับสลากได้ 3 ไปจนถึง 7

นี่คือ PDF

แต่ถ้าเราอยากรู้ว่ามีความเป็นไปได้เท่าไหร่ ที่เลขที่เราหยิบได้มีค่าน้อยกว่า หรือเท่ากับ 5

เราก็คำนวณจากพื้นที่ใต้กราฟของเรา (นับจำนวนครั้ง) ที่เราจับสลากได้ ตั้งแต่ค่าแรก  (1)  ไปจนถึง 5

นี่คือ CDF

กำลังคิดว่าจะเขียนต่อไปรอดไหมเนี่ยเรา.. เขียนแค่มาถึงตรงนี้นี้ก็เหนื่อยแย้ว