เรียนรู้ Big Data Technology



เช้าวันที่ ๒๑ ธันวาคม ๒๕๕๘ บวท. จัดการประชุมเรื่อง Digital Economy & Big Data (เศรษฐกิจดิจิตัลและฐานข้อมูลขนาดใหญ่) ทำให้ผมตระหนักว่า เทคโนโลยีเรื่องนี้ก้าวหน้าเร็วมาก ต่างจากที่ผมเคยบันทึกไว้ที่นี่เป็นคนละภาพทีเดียว อ่านเอกสารหลักการของการประชุม และกำหนดการประชุม ที่นี่

ภาพที่ผมมองเห็นเปลี่ยนไปอย่างชัดเจน คือคุณค่าของ Big Data Technology ไม่ได้อยู่เฉพาะที่การวิเคราะห์หาความหมายจาก data เท่านั้น แต่ยังมีคุณค่าที่ช่วยให้ค่าใช้จ่ายในการเก็บ data ขนาดใหญ่ ลดลงอย่างมากมาย นับสิบนับร้อยเท่า ทำให้การเก็บข้อมูลเก่าไม่เป็นภาระต่อพื้นที่เก็บอีกต่อไป โดยพระเอกคือ Hadoop Distributed File System ที่เป็น opensource software

Hadoop ช่วยทั้งการเก็บ และการวิเคราะห์ big data

คุณค่าสำคัญที่สุดของ เทคโนโลยี Big Data คือช่วยกลับทางโจทย์วิจัยกับการเก็บข้อมูล ทำให้การวิจัยตอบโจทย์อนาคต แทนที่จะตอบโจทย์ในอดีตอย่างแต่ก่อน คือเราเก็บข้อมูลทุกอย่างที่ขวางหน้า แล้วค่อยมาตั้งโจทย์ทีหลัง ตามความต้องการเดาอนาคต ในขณะที่ในอดีต เราตั้งโจทย์ก่อน แล้วจึงเก็บข้อมูลเพื่อตอบโจทย์นั้น ทำให้ได้เฉพาะข้อมูลที่มีโครงสร้างสอดคล้องกับโจทย์เท่านั้น

ตัวอย่างของการประยุกต์เทคโนโลยีนี้เพื่อประโยชน์สาธารณะไทย คือโครงการ Agricultural Zoning Optimization ของ NECTEC ที่เรียกชื่อโครงการว่า What2Growดำเนินการโดย ดร. จุฬารัตน์ ตันประเสริฐ เอาข้อมูลปริมาณน้ำฝน อุณหภูมิภูมิอากาศ และอื่นๆ มาใช้ ยกตัวอย่างโครงการบูรณาการข้อมูลเพื่อเพิ่มประสิทธิภาพการใช้ประโยชน์ที่ดินด้านการเกษตร โดยใช้ข้อมูลจาก ๘ กระทรวง ดำเนินการนำร่องที่จังหวัดกำแพงเพชร ในปี ๒๕๕๘ และทำเสร็จแล้ว ได้โมเดลแนะนำพืชทดแทน ออกมาเป็นรายพื้นที่

มองในมุมของเกษตรกรแต่ละรายย่อย นี่คือข้อความรู้ใน mindset ของการปลูกพืชเชิงเดี่ยว ซึ่งบิดาผู้ล่วงลับของผมที่เป็นเกษตรกรที่ตั้งตัวได้ มีฐานะดี ท่านไม่ได้ทำมาหากินบนฐานผลิตภัณฑ์เดียว และน้องๆ ของผมที่เป็นเกษตรกร ๓ คน ก็จำเริญรอยตามบิดา นั่นคือ สารสนเทศที่ ดร. จุฬารัตน์เสนอ เป็นข้อมูลหนึ่งที่เกษตรกรใช้ประกอบการตัดสินใจว่าจะปลูกพืชอะไร จะเลือกทำมาหากินทางไหนบ้าง ไม่ใช่ข้อมูลสำหรับให้ทำตามแบบเชื่องๆ

วิทยากรท่านที่สอง คือ ดร. ศิษฏพงศ์ เศรษฐภัทร แห่งบริษัท G-Ableเล่าเรื่องการนำ Big Data Analytic ไปใช้ในภาคเอกชน ก็ให้ความรู้มาก เพราะท่านทำมากับมือ สรุปได้ว่า ภาคเอกชนขนาดใหญ่ต้องใช้เทคโนโลยีนี้ หรือมิฉนั้นก็จะไม่สามารถแข่งขันได้ ผมฟังท่านรู้เรื่องไม่ถึงเสี้ยว จับได้เลาๆ อย่างที่เล่ามา

อีกประเด็นหนึ่งที่ชัดคือ เทคโนโลยีก้าวหน้าไปมากแล้ว จุดอ่อนอยู่ที่ข้อตกลงเรื่องความเป็นส่วนตัวของเจ้าของข้อมูล และประเด็นเชิงจริยธรรม และกฎหมาย

ที่น่าชื่นชมคือ ดร. ศิษฏพงศ์ ได้จัดทำเว็บ www.bigdataexperience.org สำหรับให้คนเข้ามาแลกเปลี่ยนเรียนรู้ประสบการณ์การพัฒนาเครื่องมือ และการประยุกต์ใช้ Big Data Analytics

วิทยากรท่านแรก คือ ดร. ศักดิ์ เสกขุนทด ผู้อำนวยการสำนักงานรัฐบาลอิเล็กทรอนิกส์ (องค์การมหาชน) (สรอ. / EGA) ท่านกล่าวนำว่า เป้าหมายของเศรษฐกิจดิจิทัล ในบริบทไทย คือ การทำให้คนไทยใช้เทคโนโลยีดิจิตัลอย่างมีสาระ มีผลต่อเศรษฐกิจและชีวิตความเป็นอยู่ที่ดี เกิดอุตสาหกรรมไทย และมีกฎหมายคุ้มครองความเป็นส่วนตัว

ระหว่างฟัง ดร. ศักดิ์ ผมนึกในใจว่า เป้าหมายตรงกับ KM 3.0 ที่ผมกำลังผลักดันนั่นเอง แต่ทีมผมอ่อนแอเรื่องความรู้ความเข้าใจเรื่องนี้อย่างสุดสุด



จากซ้าย ดร. จุฬารัตน์, ดร. ศิษฏพงศ์ และ ดร. ภูมิ ภูมิรัตน ผู้ดำเนินรายการ


ลักษณะ 5V ของ Big Data


คำถามและคำตอบสำคัญ เกี่ยวกับ Big Data


วิจารณ์ พานิช

๒๑ ธ.ค. ๕๘



หมายเลขบันทึก: 599960เขียนเมื่อ 25 มกราคม 2016 17:29 น. ()แก้ไขเมื่อ 25 มกราคม 2016 17:29 น. ()สัญญาอนุญาต: ครีเอทีฟคอมมอนส์แบบ แสดงที่มา-ไม่ใช้เพื่อการค้า-ไม่ดัดแปลงจำนวนที่อ่านจำนวนที่อ่าน:


ความเห็น (1)

I wonder why we don't dig into hospital data (medical records without identification data) now. Very massive amount of data is available for analyses for many fields of research. In combinations with National Statistics and market research data, we may find a lot of real facts about Thailand.

พบปัญหาการใช้งานกรุณาแจ้ง LINE ID @gotoknow
ClassStart
ระบบจัดการการเรียนการสอนผ่านอินเทอร์เน็ต
ทั้งเว็บทั้งแอปใช้งานฟรี
ClassStart Books
โครงการหนังสือจากคลาสสตาร์ท