Data Mining ในโลกความจริง ตอน มันน่าสนใจอะไรนักหนา!


Data Mining ในโลกความจริง ตอน มันน่าสนใจอะไรนักหนา!

    เป็นความตั้งใจของผมในการเขียนอะไรที่มันดูยาก ๆ กลิ่นไอวิชาการสูง ๆ ให้ดูอ่านง่าย ๆ ปฏิบัติได้จริงทังในเชิงวิชาการและโลกความเป็นจริง ชุดแรกนี้ก็แล้วหยิบเอา Data Mining มาเป็นตัวแรกในการเล่าสู่กันฟัง ทั้งจากประสบการณ์ตรง การศึกษา และการ Research มาจากที่อื่น ๆ ด้วย ตามกันมาเลยแล้วกันครับ!

 Data Mining มันคืออะไรหว่า? ผมคงไม่เอาพวกประวัติหรืออะไรที่มันชวนให้ปวดหัวมาใส่ใน Blog นี้หรอกนะครับ ถ้าใครสนใจว่าใครเป็นคนคิด คิดที่ใหน คิดเมื่อไหร่นี่ก็ลองไปสืบค้นดูเอาเองแล้วกันนะครับ แต่ในที่นี้ผมอธิบายคำง่าย ๆ ของผมแล้วกันครับ ซึ่งคำง่าย ๆ ที่คนเขาแปลกันไว้ตรงตัวอยู่แล้วมันก็คือ เหมืองข้อมูล ดี ๆ นี่ละครับทีนี้ก็ตีความคำว่า เหมือง มันก็จบแล้วครับ!

คำว่าเหมืองเมื่อกล่าวถึง Data ให้ง่าย ๆ ก็คือเปรียบว่า Data ปกติมันก็คือทุกสิ่งอย่างที่อยู่ในเหมืองนั่นแหละครับ เก็บ ๆ เข้าไปอัด ๆ เข้าไป ข้อมูลบางอย่างมีค่าในบางเรื่อง ก็เหมือนเหมือง ๆ นึง มีทั้งแร่ยิปซัม ทั้งแร่ทอง ทั้งแร่เงิน(จริง ๆ มันเป็นไปไม่ได้แต่ผมสมมุติ) ก็อยู่ที่ว่าคนที่จะมาสกัดต้องการแร่อะไรบ้าง บางทีการสกัดบางแร่ออกมาอาจได้ผลพลอยได่อย่างอื่น เช่นจริง ๆ ตั้งใจมาสกัดแร่ทองคำ แต่ตอนทำดันได้แร่เงินออกมาด้วย

     เปรียบไปก็เหมือนกับว่าในระบบ IT ที่เราใช้ได้ทำการเก็บข้อมูลเกี่ยวกับการซื้อขายมหาศาลไว้ เมื่ออยู่มาวันนึงอยากสกัดบางข้อมูลออกมาจากข้อมูลที่มากมายเหล่านี้ เช่นอยากสกัดข้อมูลเกี่ยวกับกลุ่มลูกค้า แต่ทำไปทำมากลับได้ข้อมูลเกี่ยวกับสินค้าที่ขายคู่กับกลุ่มลูกค้าแต่ละกลุ่มออกมาด้วย ก็แค่นั้นแหละครั

     นึกง่าย ๆ ก็คือข้อมูลเป็นทุกสิ่งอย่างที่ร่องลอยอยู่ในเหมือง เราก็ไปสกัดเฉพาะข้อมูลที่ต้องการออกมาจากเหมืองมันก็เป็นข้อมูลที่มีค่า(แร่ที่มีค่า) ผิดกันตรงที่ว่าในการทำเหมืองนั้น พอทำแล้วอาจเกิดความเสียหายกับข้อมูลได้ และการได้แร่ใด ๆ ออกมา มันจะได้แล้วได้เลยคือมีวันหมด แต่ในมุมของ Data Mining แล้วมันไม่มีวันหมดตราบไดที่ข้อมูลยังไม่ล้าสมัยกล่าวคือวันนี้เราอาจสกัดข้อมูลลูกค้ากับสินค้า พรุ่งนี้เราอาจสัดข้อมูลลูกค้ากับพื้นที่ วันมะรืนเราอาจสกัดข้อมูลลูกค้ากับผู้จัดจำหน่ายก็ได้ ข้อมูลลูกค้าไม่ได้เสียหายไปใหน ง่ายมั้ยครับนึกถึงเหมืองเข้าไว้เดี๋ยวจะเข้าใจนิยามมันเองครับ! แล้วเดี๋ยวเรามาต่อว่าการถ้าจะทำให้ดีทำให้เร็วนั้น นอกจาก Data Mining แล้วเราก็ต้องรู้จัก Data Warehouse แล้วก็วิธีการวิเคราะห์(สกัด)  ในแต่ละวิธีกันครับ!

 

หมายเลขบันทึก: 271378เขียนเมื่อ 27 มิถุนายน 2009 02:59 น. ()แก้ไขเมื่อ 30 สิงหาคม 2013 17:32 น. ()สัญญาอนุญาต: ครีเอทีฟคอมมอนส์แบบ แสดงที่มา-ไม่ใช้เพื่อการค้า-ไม่ดัดแปลงจำนวนที่อ่านจำนวนที่อ่าน:


ความเห็น (0)

ไม่มีความเห็น

พบปัญหาการใช้งานกรุณาแจ้ง LINE ID @gotoknow
ClassStart
ระบบจัดการการเรียนการสอนผ่านอินเทอร์เน็ต
ทั้งเว็บทั้งแอปใช้งานฟรี
ClassStart Books
โครงการหนังสือจากคลาสสตาร์ท