Data Warehouse คืออะไร

  ติดต่อ

  คลังข้อมูล (data warehouse) คือ ฐานข้อมูลขนาดยักษ์ ที่รวบรวมฐานข้อมูลจากหลายแหล่งหลายช่วงเวลา  
อ้างจาก th.wikipedia.org/wiki/คลังข้อมูล

คลังข้อมูล (data warehouse) คือ ฐานข้อมูลขนาดยักษ์ ที่รวบรวมฐานข้อมูลจากหลายแหล่งหลายช่วงเวลา
คลังข้อมูลแตกต่างจากฐานข้อมูลอย่างไร?

โดยปกติแล้ว ฐานข้อมูลในองค์กรทั่วไปจะมีลักษณะที่ค่อนข้างทันต่อเหตุการณ์ เช่น ฐานข้อมูลพนักงานก็จะเก็บเฉพาะพนักงานในปัจจุบัน จะไม่สนใจข้อมูลพนักงานเก่า ๆ ในอดีต ซึ่งอาจจะมีข้อมูลอะไรบางอย่าง ที่มีประโยชน์สำหรับผู้บริหาร ในการวิเคราะห์ประสิทธิภาพและคุณลักษณะต่าง ๆ ขององค์กร. นอกจากนี้ ฐานข้อมูลแต่ละอันมักถูกออกแบบมาใช้เก็บข้อมูลเฉพาะด้าน จึงมีข้อมูลเฉพาะบางส่วนขององค์กรเท่านั้น ฉะนั้นคลังข้อมูลจึงถูกออกแบบมา เพื่อรวบรวมข้อมูลในทุกส่วนของทั้งบริษัท ทั้งเก่าและใหม่ไว้ด้วยกัน ไม่มีการลบทิ้งข้อมูลเก่า ๆ ที่ไม่จริงในปัจจุบัน

โดยสรุปคือ

  • คลังข้อมูล ใช้เพื่อการวิเคราะห์ (ข้อมูลทั้งอดีตและปัจจุบัน)
  • ฐานข้อมูล ใช้เพื่อทำการประมวลผล (เฉพาะข้อมูลปัจจุบัน)

ถ้าองค์กรมีคลังข้อมูลหลาย ๆ อันเพื่อใช้ในการวิเคราะห์ต่าง ๆ แตกต่างกันไป เช่น คลังข้อมูลด้านการเงิน และ คลังข้อมูลด้านทรัพยากรมนุษย์ เรามักเรียกคลังข้อมูลเฉพาะด้านเหล่านี้ว่า ตลาดข้อมูล data marts

อนึ่ง กระบวนการในการใช้ข้อมูลในคลังข้อมูลเพื่อการตัดสินใจ และวางแผนในทางธุรกิจ มักถูกเรียกว่า ปัญญาธุรกิจ (business intelligence)

การวิเคราะห์ข้อมูลในคลังข้อมูล

มีสองประเภทใหญ่ ๆ คือ

Online Analytical Processing

Online Analytical Processing (OLAP) คือการใช้คำค้น (query) เพื่อค้นหาข้อมูลในคลังข้อมูลเหมือนในฐานข้อมูล เหตุผลที่เราไม่ค้นในฐานข้อมูล แต่มาทำในคลังข้อมูลแทนมีสองสาเหตุคือ

  • ความเร็ว
  • ความครอบคลุมของข้อมูลทั้งบริษัทที่มีอยู่ในคลังข้อมูล
การทำเหมืองข้อมูล

การทำเหมืองข้อมูล (Data Mining) คือ การหารูปแบบ (pattern) อะไรบางอย่างที่ซ่อนอยู่ในข้อมูล ที่มองผิวเผินแล้วไม่อาจสังเกตเห็นได้ เนื่องจากข้อมูลมีปริมาณมาก เช่น การค้นหากฎความสัมพันธ์ (association rules) ของสินค้าในห้างสรรพสินค้า เราอาจพบว่าลูกค้าร้อยละ 90 ที่ซื้อเบียร์ จะซื้อผ้าอ้อมเด็กด้วย, ซึ่งเป็นข้อมูลให้ทางห้างคิดรายการส่งเสริมการขายใหม่ๆ ได้; หรือ ธนาคารอาจพบว่า คนทั่วไปที่มีอายุ 20-29 ปี และมีรายได้ในช่วง 20,000-30,000 บาท มักซื้อเครื่องเล่นเอ็มพีสาม, ธนาคารอาจเสนอให้คนกลุ่มนี้ทำบัตรเครดิต โดยแถมเครื่องเล่นดังกล่าว เป็นต้น

 

บันทึกนี้เขียนที่ GotoKnow โดย  ใน Business Intelligence

หมายเลขบันทึก: 45018, เขียน: , แก้ไข, 2012-06-23 01:54:12+07:00 +07 Asia/Bangkok, สัญญาอนุญาต: สงวนสิทธิ์ทุกประการ, ความเห็น: 12, อ่าน: คลิก

คำสำคัญ (Tags) #computer#ai#business-intelligence#business-informatics#data-mining#bi#data-warehouse#data-warehousing

บันทึกล่าสุด 

ความเห็น (12)

นิสิต
IP: xxx.121.40.84
เขียนเมื่อ 

ขอบคุนคร๊า.....

 

ใช้ทำรายงานอย่างละเอียดเลยคร๊า....

 

^.....^

a l a i
IP: xxx.27.123.3
เขียนเมื่อ 

ขอบคุณคะ เพิ่งเข้าใจแบบจริงๆ ซะที

IP: xxx.42.64.197
เขียนเมื่อ 

ขอบคุณค่ะ

ค่อยเข้าใจหน่อย

Earth
IP: xxx.26.241.40
เขียนเมื่อ 

ขอบคุณมากครับ ผมเรียนวิชานี้หาหนังสือไม่ได้เลย ^^ มีแต่หนังสือ Eng อ่ะ อ่านแล้วต้องแปลตาม น่าเบื่อมากๆ

lb
IP: xxx.10.85.100
เขียนเมื่อ 

ข้อความเหมือนใน wiki เลยครับ

ผมอ้างอิงในบรรทัดแรกแล้วครับ ว่าเอามาจาก wiki

แต่ถ้าเป็น powerpoint ที่ผมใช้สอนอยู่ ก็เป็นอีกคนละชุดครับ ละเอียดกว่ามาก เพราะเขียนในเชิงของนักคอมพิวเตอร์ครับ

โอ๊ค
IP: xxx.128.74.90
เขียนเมื่อ 

เรียนปรึกษาคะ ตอนนี้ทำ IS เกี่ยวกับ data mining - classification เกี่ยวกับการขาย Mobile อยู่ แต่อาจารย์ให้มีการทำ ensemble รบกวนอธิบายให้หน่อยคะ อีกอย่างคือที่ SPSS Clementine Version 11.1 ไม่มี Function ตัวนี้คะ รบกวนแนะนำดด้วยคะ ขอบคุณมากๆเลยคะ

ริว
IP: xxx.172.55.171
เขียนเมื่อ 

คือผมสนใจใน Business Intelligent แล้ว จะเอามาทำโปรเจคจบ โดยคิด ว่า จะนำข้อมูล หุ้น มาวิเคราะห์ แบบนี้จะได้ป่าวครับ

อาจจะเป็นสำหรับธนาคาร เราก็ เก็บ ข้อมูล ว่าราหุ้น หรือกองทุน ตัวไหน ราคาเท่าไหร่ ซื้อขายยังไง เราก็เอามา เก็บไว้แล้ว ถ้าผู้ใช้

ต้องการรู้ว่า กองทุนหุ้นตัวไหนมีแนวโน้มอย่างไรก็ ทำการเลือก ทำรีพอร์ต ออกมา ตัวโปรแกรม ผมก็จะทำการคำนวน แล้วดึง ข้อมูล

จาก DATA mining มาคำนวน หาค่าต่างๆ เผื่อให้ องค์กร หรือผู้ลงทุนสามารถตัดสินใจได้ แบบนี้ ช่วยแนะนำ ผมหน่อยครับ ปีสี่ วิศวะ

ซอฟต์แวร์ แบบนี้ จะทำได้มั้ยคับ

โดยหลักการของมัน ไม่มีปัญหาครับ เพราะ BI ก็ต้องทำ Report ได้อยู่แล้ว (ตามหลัก Data Warehouse) ตัวแปรเดียวเก็บได้หลายค่า

แต่ปัญหาไปอยู่ที่เทคนิคที่จะนำมาวิเคราะห์แนวโน้มครับ (Trend Analysis) ว่าจะใช้การทำนายแบบไหน คุณต้องมีความรู้สถิติ และสถิติประยุกต์อย่าง Data Mining ให้มากๆ

หากเป็นสถิติพื้นฐานด้านการพยากรณ์ ก็ใช้ Linear Regression (การพยากรณ์เส้นตรง จากสมการเชิงเ้ส้น) หรือหากมีปัจจัยที่เกี่ยวข้องกับหุ้นมากกว่า 1 ตัว ก็ทำสิ่งที่ยากขึ้น เช่น Multiple Regression (สร้างสมการหลายตัวแปร เพื่อพยากรณ์ำคำตอบ)

หากต้องการพยากรณ์แบบธรรมชาติมากขึ้น ก็อาจใช้ Genetic Algorithm หรือตัวใหม่ๆอย่าง Artificial Neural Networks ไปเลยครับ

คราวนี้ลองคิดดูว่าจะเขียนโปรแกรมการวิเคราะห์ไหวไหม ^_^

อาจารย์คะ...ขอคำปรึกษาเกี่ยวกับการอ่านกฏ ของ k-means หน่อยคะ

คือว่า ทำวิจัยด้าน clustering โดยใช้ วิธี k-means แต่มีปัญฟหาเกี่ยวกับการอ่านกฏที่ได้คะ

ยังงัยขอความกรุณาอาจารย์ช่วยยกตัวอย่างการอ่านกฏ k-means หน่อยนะคะ

ขอบพระคุณมากคะ....

ปล.ตอนนี้กำลังเร่งโปรเจคอย่างมากเลยคะ จึงขอความกรุณาตอบให้ด่วนนะคะ ขอบพระคุณอีกครั้งคะ...

Nlinni
IP: xxx.28.12.191
เขียนเมื่อ 

ขอบคุณค่ะ

Surasit Tubthiang
IP: xxx.19.233.201
เขียนเมื่อ 

ขอบคุณมากครับ