แผนภาพหรือแผนภูมิการกระจาย (Scatter Plot) เป็นกราฟประเภทหนึ่งที่ช่วยให้เราเห็นว่าตัวแปรสองตัวสัมพันธ์กันอย่างไร เช่น จำนวนชั่วโมงเรียนกับคะแนนสอบ
ในการสร้างแผนภาพการกระจาย ให้ใส่ค่าของตัวแปรหนึ่งตัว เช่น ชั่วโมงที่เรียน บนแกน x (เส้นแนวนอน) และค่าของตัวแปรอื่น เช่น คะแนนสอบ บนแกน y (เส้นแนวตั้ง) จุดข้อมูลแต่ละจุดจะแสดงด้วยจุดบนกราฟ
ตัวอย่างเช่น ข้อมูลนักเรียน 5 คน: นักเรียน A เรียน 2 ชั่วโมงและได้เกรด 80 นักเรียน B เรียน 3 ชั่วโมงและได้เกรด 85 เป็นต้น พล็อตจุดเหล่านี้บนกราฟ โดยจุดหนึ่งจุดสำหรับนักเรียนแต่ละคน
หากจุดส่วนใหญ่ขึ้นจากซ้ายไปขวา แสดงว่าเมื่อจำนวนชั่วโมงเรียนเพิ่มขึ้น คะแนนสอบก็มีแนวโน้มเพิ่มขึ้นเช่นกัน ชี้ให้เห็นถึงความสัมพันธ์เชิงบวกระหว่างชั่วโมงเรียนและคะแนนที่สูงขึ้น
ในทางกลับกัน ถ้าจุดส่วนใหญ่ไล่ลงมาจากซ้ายไปขวา หมายความว่าเมื่อจำนวนชั่วโมงที่เรียนเพิ่มขึ้น คะแนนสอบจะลดลง สิ่งนี้ชี้ให้เห็นถึงความสัมพันธ์เชิงลบระหว่างชั่วโมงเรียนและคะแนนที่ต่ำลง
ความสัมพันธ์: แผนภาพการกระจายใช้เพื่อสังเกตความสัมพันธ์ระหว่างตัวแปร และช่วยให้ข้อมูลต่อไปนี้อีกด้วย เช่น
ทิศทาง: หากตัวแปรทั้งสองมีแนวโน้มที่จะเพิ่มขึ้นหรือลดลงพร้อมกัน ความสัมพันธ์จะเป็นค่าบวก หากตัวแปรหนึ่งมีแนวโน้มที่จะเพิ่มขึ้นในขณะที่อีกตัวแปรหนึ่งลดลง ความสัมพันธ์นั้นจะเป็นค่าลบ
ความแน่นแฟ้น: ยิ่งจุดในแผนภาพกระจายเข้าใกล้เส้นตรงมากเท่าไหร่ ความสัมพันธ์ระหว่างตัวแปรก็จะยิ่งแน่นแฟ้นมากขึ้นเท่านั้น
รูปร่าง: ความสัมพันธ์เชิงเส้นจะก่อตัวเป็นเส้น ในขณะที่ความสัมพันธ์ที่ไม่ใช่เชิงเส้นอาจก่อตัวเป็นรูปร่างที่ซับซ้อนกว่า เช่น พาราโบร่า
ค่าผิดปกติ: ค่าผิดปกติคือการสังเกตที่อยู่ห่างผิดปกติจากค่าอื่นๆ ในแผนภาพกระจาย จะมองเห็นค่าผิดปกติเป็นจุดที่แยกออกจากจุดที่เหลือได้
ข้อมูลชั่วโมงเรียนและคะแนนสอบของนักเรียน 30 คนเป็นดังนี้
สามารถสร้างแผนภาพการกระจายได้ดังนี้
แผนภาพการกระจายช่วยให้เราเห็นภาพความสัมพันธ์ระหว่างชั่วโมงเรียนและคะแนนสอบในชุดข้อมูลของนักเรียน 30 คน ซึ่งมีแนวโน้มในเชิงบวกบ่งชี้ว่าการเรียนหลายชั่วโมงมีแนวโน้มที่จะนำไปสู่คะแนนสอบที่สูงขึ้น
ไม่มีความเห็น