ฟังง่าย แต่ทำยาก
เหตุผลคือข้อเท็จจริงอาจเป็นของแสลง
ถ้าประเทศไทยจะมีฐานข้อมูลอะไำรก็แล้วแต่ ในระดับชาติ คำถามที่ต้องตอบให้ได้ก่อนคือ ข้อมูลทั้งหลายที่ใช้อยู่นั้น จริงหรือเปล่า ?
"garbage in, garbage out" คือคำขวัญของผู้ที่ต้องเรียนการเขียนโปรแกรม ...ใส่ขยะไป สิ่งที่จะออกมา ก็ยังเป็นขยะ
คำนี้มีคนเถียงว่า ขยะเหรอ มาเลย เดี๋ยวจะ data mining ให้ดู ให้รู้ซะมั่งว่ามีทองคำในเหมืองข้อมูล
ก็ต้องแยกแยะกันหน่อยว่านิยามคำว่าขยะไว้ยังไง ผมเองมองว่าข้อมูลที่โกหก ก็คือขยะ ส่วนข้อมูลดิบที่หยุมหยิมเหมือนไร้สาระแต่เป็นจริง ไม่ใช่ขยะ ซึ่งในนิยามนี้ ทำ data mining ก็จะเกิด "ขยะ in - ขยะ out" อยู่ดี
บางที เรื่องการขัดแย้งเชิงผลประโยชน์ อาจลามเข้ามาเกี่ยวข้อง เช่น สมมติว่ามีสถิติเกี่ยวกับโรคที่องค์การอนามัยโรคมองว่าเป็นเรื่องใหญ่มาก จนคนที่รับผิดชอบอยากได้หน้าว่าจัดการดีไม่มีโรค ก็ใช้วิธีกลบปัญหาไว้ จนคนที่เกี่ยวข้องนอกแวดวงอาจต้องออกมากระทุ้งผ่านสื่อมวลชนว่าปิดข่าวกันหรือเปล่า โรคแบบนี้ คนที่เขาอยู่ในแวดวงเขาจะก็จะไม่เชื่อถือรายงาน เพราะเขาสงสัยว่า ไม่ใช่การจดตกหล่น ("under report") แต่เป็นการสนองนโยบายต้องไม่จด ("you must not report")
เรียบง่ายและชัดเจนคือการบันทึกแบบตรงไปตรงมา ไม่ต้องใช้ภาษาที่สละสลวยหรือวกวนเพื่อกลบซ่อนข้อเท็จจริง หลีกเลี่ยงการใช้คำย่อ หรือภาษาที่ชวนให้เข้าใจผิด
คำย่อเป็นเรื่องหนึ่ง ที่ต้องระวัง
เพราะอย่างแรก คนอื่นอาจเข้าใจไม่ตรงกับเรา
อย่างที่สอง การย่อสั้น ๆ ก็เป็นไปได้มากว่าตาลาย อ่านผิดไปสักตัว ความหมายกลายเป็นอื่นไป
ตาลายเพราะคำย่อ มีความเสี่ยงสูงกว่าตาลายเพราะคำเต็ม
เที่ยงตรงคือการบันทึกที่ปราศจากอคติ มีความเชื่อถือได้ว่าจริง
การบันทึกที่ดีจึงมักไม่นิยมใส่ความคิดเห็นส่วนตัวของผู้ประเมินลงไปในตัวข้อมูลดิบ เพราะความคิดเห็นอาจถูกหรือผิดก็ได้
แต่ถ้าสามารถบันทึกความคิดเห็นแยกออกมาให้เป็นกิจจะลักษณะได้ โดยระบุระดับของข้อความให้ชัดเจนว่าเป็นเพียงความคิดเห็น (ของใคร อิงจากวิธีคิดแบบใด) หรือเป็นการอ้างอิงหลักฐาน (พร้อมระบุรายละเอียด) ก็จะดี เพราะบางทีความรู้ระดับลึกที่ซ่อนอยู่ อาจเห็นได้จากส่วนเพิ่มเติมนี่แหละ
ในปี 2540 เศรษฐวิบัติในช่วงต้มยำกุ้ง เคยมีผู้ฟันธงว่า วิกฤติส่วนหนึ่งเกิดจากนักบัญชีที่ไม่มีจรรยาวิชาชีพบางคนที่รู้เห็นเป็นใจกลบซ่อนหนี้เน่า
จากนั้นมา จนถึงทุกวันนี้ ผมก็ยังเคยได้ยินคนที่เรียกตลาดหลักทรัพย์ว่าตลาดลักทรัพย์อยู่เป็นระยะ
เคยมีกรณีตัวอย่างที่ธนาคารใหญ่เมืองนอกล้ม และล้มดังพอที่จะทำให้ตลาดทุนปั่นป่วนไปทั้งโลก
ก่อนล้ม หมายเหตุประกอบงบดุลสั้น ๆ ที่ดูคลุมเครือในบรรทัดสุดท้าย สามารถซ่อนสถานะที่มีปัญหาร้ายแรงที่ใหญ่กว่าตัวธนาคาร (มีการซ่อนสถานะการเก็งกำไรในตราสารอนุพันธ์ โดยกลบปัญหาด้วยลูกเล่นทางบัญชี) ซึ่งความมาแตกเอาหลังจากล้มละลายแล้ว
อย่าดูถูกว่าข้อมูลบรรทัดเดียวจะไม่มีพิษสงนะครับ
ใส่ขยะไป สิ่งที่จะออกมา ก็ยังเป็นขยะ
อาจารย์คะ ถ้าไม่มี ขยะ
Wall E อาจป่วยเป็น Major depessive disorder แน่ ๆ
อาจารย์ไปดูนะคะ แล้วจะรัก..Wall E,Le vie en Rose,Eve,ต้นไม้ต้นเล็ก ๆในบู๊ต
แล้วก็อาจ จะเลิกรัก คอมพิวเตอร์, ซอฟแวร์(ละมุนภัณฑ์)....
จริงนะคะ !!!!!(ยืนยัน)