K-means Alogrithm

พอดีไปอ่านเจอวิธีการของ K-means Algorithm เห็นน่าสนใจดี ก็เลยนำมาฝากทุกท่านเผื่อมีใครสนใจคะ ยิ้มๆ

K-means Algorithm : เป็นวิธีการหาจุดกึ่งกลางของกลุ่ม โดยกำหนดจำนวนกลุ่ม K ไว้ล่วงหน้า มีขั้นตอนการทำงานเริ่มจาก...

1) สุ่มเลือกจุดกึ่งกลางของแต่ละกลุ่ม
2) วัดระยะห่างระหว่างข้อมูลหรือระยะห่างน้อยที่สุดในการแบ่งกลุ่มข้อมูล
3) คำนวณหาจุดกึ่งกลางใหม่ของแต่ละกลุ่ม
4) วัดระยะห่างของแต่ละข้อมูลเพื่อเปรียบเทียบกับจุดกึ่งกลางใหม่ เพื่อกำหนดกลุ่มให้กับข้อมุล โดยจะทำแบบนี้ไปเรื่อย ๆ จนกว่าจะได้จุดกึ่งกลางที่ไม่มีการเปลี่ยนแปลงกลุ่ม

โดยที่ Mk เป็นจุดกึ่งกลางในแต่ละ cluster

โดยจำนวน k ที่เหมาะสมอาจใช้หลักการของ euclidian distance เป็นเกณฑ์ในการพิจารณาจัดกลุ่มว่ามีค่าระยะห่างยกกำลังสองจากจุดกึ่งกลางอยู่ที่เท่าไหร ซึ่งเรียกว่า SSE นั่นเอง (SSE ย่อมาจาก Sum of squared errors)

Alogithm นี้ สามารถนำไปประยุกต์ได้หลายอย่าง เช่น การนำไปใช้ในการหากฎความสัมพันธ์ของการจำแนกเอกสาร หรือนำไปใช้ในการกำหนดความสัมพันธ์ของการจำแนกกลุ่มต่างๆ ได้ด้วย

ความเห็น

บทความในวันเดียวกัน