พอดีไปอ่านเจอวิธีการของ K-means Algorithm เห็นน่าสนใจดี ก็เลยนำมาฝากทุกท่านเผื่อมีใครสนใจคะ ยิ้มๆ
K-means Algorithm : เป็นวิธีการหาจุดกึ่งกลางของกลุ่ม โดยกำหนดจำนวนกลุ่ม K ไว้ล่วงหน้า มีขั้นตอนการทำงานเริ่มจาก...
1) สุ่มเลือกจุดกึ่งกลางของแต่ละกลุ่ม
2)
วัดระยะห่างระหว่างข้อมูลหรือระยะห่างน้อยที่สุดในการแบ่งกลุ่มข้อมูล
3) คำนวณหาจุดกึ่งกลางใหม่ของแต่ละกลุ่ม
4) วัดระยะห่างของแต่ละข้อมูลเพื่อเปรียบเทียบกับจุดกึ่งกลางใหม่
เพื่อกำหนดกลุ่มให้กับข้อมุล โดยจะทำแบบนี้ไปเรื่อย ๆ
จนกว่าจะได้จุดกึ่งกลางที่ไม่มีการเปลี่ยนแปลงกลุ่ม
โดยที่ Mk เป็นจุดกึ่งกลางในแต่ละ cluster
โดยจำนวน k ที่เหมาะสมอาจใช้หลักการของ euclidian distance เป็นเกณฑ์ในการพิจารณาจัดกลุ่มว่ามีค่าระยะห่างยกกำลังสองจากจุดกึ่งกลางอยู่ที่เท่าไหร ซึ่งเรียกว่า SSE นั่นเอง (SSE ย่อมาจาก Sum of squared errors)
Alogithm นี้ สามารถนำไปประยุกต์ได้หลายอย่าง เช่น การนำไปใช้ในการหากฎความสัมพันธ์ของการจำแนกเอกสาร หรือนำไปใช้ในการกำหนดความสัมพันธ์ของการจำแนกกลุ่มต่างๆ ได้ด้วย
มาเชียร์
K-means Algorithm
ขอบคุณค๊าาาา ยิ้มๆ
ไม่มีตัวอย่างหรอครับ