Data Mining


เหมืองข้อมูล (Data Mining) หมายถึง การดึงข้อมูลจากฐานข้อมูลที่มีขนาดใหญ่เพื่อนำข้อมูลนั้นมาใช้งานให้เกิดประโยชน์สูงสุด

ปัจจุบันระบบฐานข้อมูลมีความสำคัญอย่างมากกับระบบธุรกิจ ดังนั้นจึงมีการใช้กลยุทธ์วิธีการต่างๆ เพื่อดึงเอาข้อมูลที่มีประโยชน์สูงสุดจากฐานข้อมูลมาใช้ ซึ่งในปัจจุบันการวิเคราะห์ข้อมูลจากฐานข้อมูลเดียวอาจไม่ให้ความรู้เพียงพอและลึกซึ้งสำหรับการดำเนินงานภายใต้ภาวะที่มีการแข่งขันสูงและมีการเปลี่ยนแปลงที่รวดเร็ว จึงจำเป็นที่จะต้องรวมฐานข้อมูลหลายๆ ฐานข้อมูลเข้าด้วยกัน เพื่อการวิเคราะห์ที่ลึกซึ้ง การรวมฐานข้อมูลหลายๆ ฐานข้อมูลเข้าด้วยกันเรียกว่า คลังข้อมูล (Data Warehouse) ดังนั้นสามารถสรุปได้ว่า เหมืองข้อมูล (Data Mining) หมายถึง การดึงข้อมูลจากฐานข้อมูลที่มีขนาดใหญ่เพื่อนำข้อมูลนั้นมาใช้งานให้เกิดประโยชน์สูงสุด

ขั้นตอนการทำเหมืองข้อมูลมีการแบ่งขั้นตอนการทำงานที่แตกต่างกันไปตามทฤษฏีที่ผู้จัดการเหมืองข้อมูลแต่ละคนใช้อ้างอิง ดังนั้นจึงไม่มีขั้นตอนการทำงานของเหมืองข้อมูลที่แน่นอน แต่สามารถแบ่งขั้นตอนการทำงานของเหมืองข้อมูลคร่าว ๆ ได้ดังนี้
 1.  เรียนรู้ขอบเขตของการประยุกต์ใช้เหมืองข้อมูล (Learning)
 2.  สร้างชุดของข้อมูลจากกลุ่มข้อมูลที่เลือกไว้ (Data Selection)
 3.  ตัดข้อมูลที่ไม่สำคัญออกไป (Data Cleaning)
 4.  แปลงข้อมูลให้อยู่ในรูปที่สามารถนำไปใช้งานได้ (Data Reduction and Transformation)
 5.  เลือกวิธีการจัดการเหมืองข้อมูล (Choosing Function of Data Mining)
 6.  เลือกอัลกอริทึมที่ใช้จัดการ (Choosing the Mining Algorithm)
 7.  ใช้ความรู้ที่ได้มานำไปสร้าง Model (Use of Discovered Knowledge)

คำสำคัญ (Tags): #data mining
หมายเลขบันทึก: 226835เขียนเมื่อ 2 ธันวาคม 2008 14:02 น. ()แก้ไขเมื่อ 21 มิถุนายน 2012 19:12 น. ()สัญญาอนุญาต: จำนวนที่อ่านจำนวนที่อ่าน:


ความเห็น (0)

ไม่มีความเห็น

พบปัญหาการใช้งานกรุณาแจ้ง LINE ID @gotoknow
ClassStart
ระบบจัดการการเรียนการสอนผ่านอินเทอร์เน็ต
ทั้งเว็บทั้งแอปใช้งานฟรี
ClassStart Books
โครงการหนังสือจากคลาสสตาร์ท