Data Mining ในโลกความจริง ตอน เข้าใจภาพกว้างกันดีกว่า!


Data Mining ในโลกความจริง ตอน เข้าใจภาพกว้างกันดีกว่า!

      ผมว่าหลายคนคงงงกับคำหลาย ๆ คำที่มันเกี่ยวข้องกับ Data Mining ยิ่งอ่านยิ่งงง ทำให้เกิดความรู้สึกไม่อยากเข้าไปยุ่งกับมันซักเท่าไหร่ แต่เชื่อมั้ยครับว่าสิ่งที่คุณดูเหมือนกับมันซับซ้อนนั้นมันช่างสวยงามและเรียบง่ายเสียเหลือเกิน และผมเข้าใจว่าคนคิดทฤษฏีและที่พยายามจะนำมาปรับใช้นั้นท่านก็คงมีจุดมุ่งหมายให้อะไ อะไรมันออกมาดูง่ายเหมือนกัน

 

DW

          จากรูปที่แสดงเป็นรูปที่แสดงให้เห็นความสัมพันธ์อะไรบางอย่าง ถึงตรงนี้ถ้าอ่านจนเข้าใจแล้วในเบื้องต้นเล็ก ๆ ก็จะเข้าใจได้ถึงคำว่า Database, Data Wharehouse, กับ Data Mining(BI) มันแตกต่างหรือสัมพันธ์กันอย่างไร เอาล่ะผมพยายามบอกว่าจะทำให้ง่ายนะครับ แต่ตรงนี้มันก็มีกลิ่นไอของทฤษฏีอย่บ้าง ก่อนอื่นจูนตัวเองล้างหน้าล้างตาให้สดชื่นก่อนนะครับแล้วจะมาทำความเข้าใจหลักการจากรูปกัน ไป ไปล้างหน้าล้างตาก่อนแล้วตามผมมาได้เลยครับ!

          จากรูปนะครับง่าย ๆ เลยสีเทาคือระบบ IT หรืออาจจะบอกได้ว่ามันคือ Database ของแต่ละระบบซึ่งแยกเป็นระบบหนึ่งห็หน่วยงานหนึ่ง(ในที่นี้ผมคิดในเชิงที่แต่ละแผนกใช้ระบบต่างกันไม่ได้เป็น ERP ตัวเดียวทั้งบริษัทนะครับ) แต่ละหน่วยงานก็มีข้อมูลของตัวเอง แต่บางกรณีแลัวต่างหน่วยงานกันก็จะมีข้อมูลที่ใช้ร่วมกันได้ ในภาพประกอบอักษรภาษาอังกฤษตัวใหญ่คือ Data ในแต่ละแผนก เช่นข้อมูลของระบบบัญชีที่มีข้อมูล A,B,C แล้วข้อมูลของระบบขายก็มี C,D,E ในกรณีนี้ มี C ที่ซ้ำกันอยู่ซึ่งอาจจะเป็นชุดข้อมูลที่ใช้ด้วยกัน เช่นรหัสบัญชีสินค้า และนี่ล่ะครับคือมุมมอง Database ในสถาปัตรยกรรมของ Data Mining

          ทีนี้พอแต่ละที่มีข้อมูลที่นิ่งแล้วเช่นยอดขายที่สรุปแล้ว ระบบบัญชีที่ปิดรายวันแล้ว พอข้อมูลไม่มีการเปลี่ยนแปลงเราก็จะยกชุดข้อมูลเหล่านี้ เอาไปเก็บในรูปแบบที่เหมาะสมเพื่อเอาไว้ทำการวิเคราะห์ต่อไป หลายคนคงเกิดคำถามว่าแล้วอะไรคือรูปแบบที่เหมาะสม ก็ต้องตอบง่าย ๆ ว่า ถ้าในการวิเคราะห์ข้อมูลองค์กรไม่ได้จำเป็นต้องรู้ละเอียดมากนักข้อมูลที่เก็บที่ Data Wharehouse ก็อาจเป็นข้อมูลสรุปได้ เช่น ในการขายสินค้าหน้าร้านเกิดรายทุกนาที เราจะไม่ได้เอาข้อมูลทุกนาทีนี้ไปเก็บใน Data Wharehouse หรอกยะครับ เราก็จะดูความเหมาะสมว่าในการวิเคราะห์เราต้องการข้อมูลลึกแค่ใหน เช่นหากไม่สนในช่วงเวลาแล้ว ข้อมูลการขายที่ยกไปที่ Data Wharehouse อาจเป็นยอดขายของสินค้าแต่ละตัวในหนึ่งวัน แต่ถ้าต้องการระบุลงลึกไปว่าในช่วงเวลาหนึ่งวันส่วนมากขายดีช่วงใด อันนี้ก็อาจต้องใช้หลักของ Data Mining (เดี๋ยวจะพูดอีกที) มาทำการแบ่งเวลาให้เหมาะสม โดยอาจจะเป็นว่า ช่วงก่อนเที่ยง, ช่วงบ่าย, ช่วงค่ำ ขายสินค้าแต่ละตัวได้เท่าไหร่

ง่วงแล้วครับขอพักก่อน ต่อพรุ่งนี้นะครับ…

หมายเลขบันทึก: 271379เขียนเมื่อ 27 มิถุนายน 2009 03:13 น. ()แก้ไขเมื่อ 30 สิงหาคม 2013 17:31 น. ()สัญญาอนุญาต: ครีเอทีฟคอมมอนส์แบบ แสดงที่มา-ไม่ใช้เพื่อการค้า-อนุญาตแบบเดียวกันจำนวนที่อ่านจำนวนที่อ่าน:


ความเห็น (0)

ไม่มีความเห็น

พบปัญหาการใช้งานกรุณาแจ้ง LINE ID @gotoknow
ClassStart
ระบบจัดการการเรียนการสอนผ่านอินเทอร์เน็ต
ทั้งเว็บทั้งแอปใช้งานฟรี
ClassStart Books
โครงการหนังสือจากคลาสสตาร์ท