Big Data (อภิมหาข้อมูล) เทคในโลยีเพื่อช่วยสนองความต้องการของมนุษย์แห่งศตวรรษใหม่


          ถ้าพูดถึง Big Data ก็จะมีเทคโนโลยีที่ตีคู่กันมา ได้แก่ Cloud Computing และ Internet of Things สรุปความสัมพันธ์ของสามสิ่งนี้ง่าย ที่เหลือมีข้อมูลบนอินเตอร์เน็ตให้ศึกษาได้ชนิดที่ว่า "มากเกินไป" เพราะอะไรหนะหรือ เพราะเรากำลังก้าวเข้าสู่ยุค Big Data ที่เรากำลังต้องการเทคโนโลยีทางการที่เหนือชั้น ซับซ้อน รวดเร็ว แม่นยำ กว่าเดิมในการค้นหา วิเคราะห์ ให้กับข้อมูลที่ "มากเกินไป" สำหรับผู้บริโภคอย่างเราๆ หรือองค์กรที่ต้องการพฤติกรรมของลูกค้าที่มีคุณภาพ

         ความสัมพันธ์อย่างง่ายที่ว่า คือ Internet of Things ก็เสมือนตัวเก็บข้อมูลจากโลก Analog (คือทุกอย่าง) ด้วยอุปกรณในชีวิตประจำวันที่มี Sensor และสามารถเชื่อมต่อเข้าสู่ Internet (เข้าใจชัดๆ ที่นี่ => http://www.youtube.com/watch?v=Cpbbrpgwu2I) ข้อมูลที่ได้ก็จะกลายมาเป็นข้อมูลดิบขนาดใหญ่ที่รอการสกัดเพื่อนำไปใช้ให้เกิดประโยชน์ หากกระบวนการดังกล่าวมันมีการเรียนรู้ ปรับตัว ด้วยตัวมันเองก็จะกลายมาเป็นส่วนที่เรียกว่า Intelligence ทั้งหลายทั้งปวงที่เกี่ยวข้องกับข้อมูลก็คือเรื่องของ Big Data t (เข้าใจชัดๆ ที่นี่ => http://www.youtube.com/watch?v=eEpxN0htRKI) ท้ายสุดก็เป็นเรื่องของรูปแบบที่รองรับข้อมูล การนำข้อมูลไปใช้ รวมไปถึงเครื่องมือที่ใช้จัดการกับข้อมูล ซึ่งในอดีตต่างคนก็ต่างเก็บข้อมูลบนอุปกรณ์ของตน ใช้โปรแกรมของใครของมัน ใช้เครื่องคอมพิวเตอร์ก็ของใครของมัน เป็นแบบ Stand alone เวลาจ่ายก็แยกกันจ่ายแบบซื้อก่อนค่อยจ่าย ทำให้บางครั้งไม่ได้ใช้ ใช้ไม่คุ้ม ใช้ไม่ครบ แต่ก็ต้องจ่ายเหมา จึงเป็นที่มาของ Cloud Computing ที่ทำให้สังคม Digital เปลี่ยนจาก Standalone มาเป็น Network อย่างสมบูรณ์ รวมไปถึง Business model ก็เปลี่ยนเป็นการจ่ายตามการใช้งานจริง (Pay per user) แถมยังช่วยลดความวุ่นวายของ IT ให้กับธุรกิจอีกด้วย (เข้าใจชัดๆ ที่นี่ => http://www.youtube.com/watch?v=ae_DKNwK_ms)

          กลับมาที่ Big Data จะมีประเด็นหลักที่ต้องบริหารจัดการ 3 ด้าน ที่เรียกกันว่า 3Vs ได้แก่
- Volume คือ มืจำนวนข้อมูลมากเกินกว่าระบบฐานข้อมูลแบบเดิมๆจะสามารถที่จะจัดการได้
- Velocity คือ ข้อมูลจะมีการเปลี่ยนแปลงอย่างรวดเร็ว เช่นข้อมูลจาก Social Media ข้อมูลการซื้อขาย ข้อมูล Transaction การเงินหรือการใช้โทรศัพท์ หรือข้อมูลจาก Sensor
- Variety คือ ข้อมูลจะมีหลากหลายรูปแบบทั้ง Structure และ Unstructure ซึ่งอาจจะอยู่ในรูปทั้ง RDBMS, text, XML, JSON หรือ Image

          ดังนั้นการจัดการ Big Data จึงจำเป็นต้องใช้ระบบการเก็บข้อมูลหรือการประมวลในรูปแบบอื่นๆที่อาจไม่ใช้เพียงแค่ฐานข้อมูล RDBMS แบบเดิมๆ ซึ่งหากเราพิจารณา Ecosystems ของ Big Data เราจะสามารถจะเห็นได้ว่ามีความเกี่ยวข้องกับโครงสร้างพื้นฐานไอทีหลายๆด้าน ดังรูป

          ซอฟต์แวร์ที่สำคัญตัวหนึ่งที่มีการนำมาใช้กันมาในระบบ Big Data คือ Hadoop เพราะ Hadoop เป็น Open Source Technology ที่จะทำหน้าที่เป็น Distributed Storage ที่สามารถเก็บข้อมูลขนาดใหญ่ที่เป็น Unstructure และนำมาประมวลผลได้ โดยองค์ประกอบหลักๆของ Hadoop จะประกอบด้วย Hadoop Dustributed File System (HDFS) ที่ทำหน้่าที่เป็น Storage และ MapReduce ที่ใช้ในการพัฒนาโปรแกรมประมวลผล โดยโครงสร้างด้าน Hardware ของ Hadoop จะใช้เครื่อง Commodity Server จำนวนมากต่อเป็น Cluster กัน ทั้งนี้ Hadoop จะไม่ได้นำมาแทนที่ระบบฐานข้อมูลเดิมแต่เป็นการใช้งานร่วมกันทั้ง Database แบบเดิมที่เป็น Structure Data และการนำ Unstructure Data ขององค์กรที่อาจเก็บไว้ในระบบอย่าง Hadoop เข้ามาพิจารณาร่วมกับข้อมูลอื่นๆภายนอก เช่น Facebook แล้วนำมาวิเคราะห์ข้อมูลโดยใช้เครื่องมืออย่าง Business Intelligence ดังรูป

         ข้อสังเกตคือ จะมีขยะข้อมูลแล้วมี Data recycle ไหม เพราะด้วยความเร็ว ปริมาณ จะ optimize ไหวหรือไม่ ต้นทุนที่ทำคุ้มหรือไม่ ผมว่าอาจจะต้องมานั่งคิด ... ปริมาณ data เพิ่มตามกิเลสคน, ความซ้อนซ้อน data ก็แปรตาม ความซับซ้อนของกิเลส, data ที่จริงคือแสง กิเลสก็คือแสง, กิเลสเป็นแสงต้นทาง สิ่งต่างๆรอบตัวรวมถึง data เป็นแสงปลายทาง, ถ้าจิตไม่มีกิเลส ไม่มีความต้องการ ก็ไม่มี data อย่างที่เราเห็น Big data ก็จะไม่เกิด, ผัสสะมนุษย์มันไม่พอเพียงสำหรับกิเลสซะแล้ว มันจึงสร้าง internet of things ขึ้นมาเพิ่มศักยภาพ, ถ้าจะสร้าง indicator วัดกิเลสมนุษย์ (HWI: Human Wants Index) ก็ให้วัดที่ขนาดของ Big Data.

ฤา ... Human Wants Index = Amount of Big Data ว่ากันไปนั่น

Slide Share : "อภิมหาข้อมูล" - How Big Data is changing the world.
http://www.slideshare.net/lersmethasakul/big-data-29497605

Slide Share : Big Data & Hadoop - The future of information economy.
http://www.slideshare.net/lersmethasakul/big-data-hadoop-29989745

อ้างอิง : Big Data และเทคโนโลยี Hadoop กับการพัฒนาองค์กรด้านการวิเคราะห์ข้อมูล โดย ดร.ธนชาติ นุ่มนนท์

หมายเลขบันทึก: 567781เขียนเมื่อ 11 พฤษภาคม 2014 21:37 น. ()แก้ไขเมื่อ 12 พฤษภาคม 2014 08:37 น. ()สัญญาอนุญาต: ครีเอทีฟคอมมอนส์แบบ แสดงที่มา-ไม่ใช้เพื่อการค้า-ไม่ดัดแปลงจำนวนที่อ่านจำนวนที่อ่าน:


ความเห็น (1)

ขอบคุณค่ะ กำลัวสนใจเรื่อง Big Data อยู่พอดี

พบปัญหาการใช้งานกรุณาแจ้ง LINE ID @gotoknow
ClassStart
ระบบจัดการการเรียนการสอนผ่านอินเทอร์เน็ต
ทั้งเว็บทั้งแอปใช้งานฟรี
ClassStart Books
โครงการหนังสือจากคลาสสตาร์ท