ในช่วงวันหยุดที่ผ่านมาได้มีนักศึกษาระดับปริญญาโทสาขาวิศวกรรมคอมพิวเตอร์ท่านหนึ่งได้ติดต่อขอฐานข้อมูลดิบ (database) ของ GotoKnow เพื่อใช้ในการทำวิทยานิพนธ์ ผมได้ตอบอีเมลนักศึกษาท่านนั้น แล้วจึงขอนำมาเรียบเรียงเป็นบันทึกไว้ที่นี่ครับ
กระบวนการในการจะเปิดเผย database ของ GotoKnow นั้นต้องใช้เวลาและเป็นกระบวนการทางสังคมเนื่องจากเกี่ยวพันถึงความไว้วางใจ (trust) ของชุมชนผู้ใช้ที่ใช้บริการของเราครับ แม้ว่าเราจะบอกว่าเอา fields ตามที่ผู้วิจัยบอกว่าไม่เกี่ยวข้องออกแล้วก็ตามก็ไม่ได้หมายความว่าการเปิดเผยข้อมูลนั้นจะได้รับอนุญาตจากชุมชนครับ เพราะมีกระบวนการอีกมากในการเอาข้อมูลนี้ไปประมวลผลต่อ อาทิเช่น ถ้าฐานข้อมูลนี้หลุดไปในมือของนักการตลาดของบริษัทใดบริษัทหนึ่ง อาจใช้ data mining algorithms บางอย่างเพื่อหาค่าอะไรบางอย่างจากเนื้อหาแล้วเอาผลลัพธ์นั้นไปรบกวนผู้ใช้ได้ เป็นต้นครับ
งานวิจัยของ UsableLabs เป็นเรื่อง Human-Computer Interaction ครับ เรื่องสำคัญด้าน HCI ที่เราปฎิบัติอย่างต่อเนื่องและเข้มข้นในการบริหารจัดการเว็บไซต์อย่าง GotoKnow คือ "ความไว้วางใจ" (trust) ที่ผู้ใช้มีต่อระบบครับ การให้ฐานข้อมูลดิบของแก่บุคคลใดบุคคลหนึ่งโดยไม่ได้ปรึกษาและได้ความยินยอมจากชุมชนผู้ใช้จะเป็นการทำลายความไว้เนื้อเชื่อใจที่ผู้ใช้มีต่อเราอย่างสิ้นเชิงครับ
อย่างไรก็ตามเรามีแผนการเปิดเผย database ของ GotoKnow เป็น public asset ดังเช่นที่ Wikipedia ทำ เพราะนั่นคือเป้าหมายสูงสุดของเราในการสร้างเว็บไซต์ GotoKnow เพราะอีกหลายสิบปีหลายร้อยปีหลังจากนี้ สิ่งที่อยู่ใน database ของ GotoKnow จะเป็นบันทึกประวัติศาสตร์ที่สำคัญอย่างยิ่งชิ้นหนึ่งของประเทศไทยครับ
งานอีกส่วนหนึ่งที่ UsableLabs ทำคือ Digital Anthropology ครับ เรื่องนี้เป็นอีกเรื่องที่สำคัญมาก ประวัติศาสตร์ของประเทศไทยได้สูญหายไปเป็นจำนวนมากตั้งแต่เราเริ่มมีเทคโนโลยีเว็บ ไม่น่าเชื่อแต่เป็นความจริงครับ อาทิเช่น เนื้อหาของเว็บไซต์ของรัฐสภาในการร่างกฎหมายครั้งล่าสุดนั้น ถ้าค้นหาตอนนี้แม้จะพอหาได้จาก Archive.org แต่ก็ไม่สมบูรณ์อย่างยิ่ง (นี่คือสาเหตุที่ UsableLabs มีโครงการ Archive.in.th รอดำเนินการอยู่)
แม้เราจะตั้งเป้าหมายในการเปิดเผยฐานข้อมูลดิบของ GotoKnow ในอนาคตแต่กระบวนการนั้นต้องอาศัยการประมวลผลและความยินยอมจากผู้ใช้ครับ เราได้เริ่มดำเนินการนี้แล้วสังเกตได้ว่าเราเริ่มมีส่วนให้เลือก license ของเนื้อหาในช่วงที่ผ่านมาครับ ซึ่งเราจะดำเนินการต่อไปตามลำดับแต่ต้องใช้เวลาและความรอบคอบอย่างยิ่งครับ
การเปิดเผย database นี้ต้องผ่านกลไกสองอย่างเพื่อรักษาความไว้วางใจของผู้ใช้ที่มีต่อระบบครับ
ในการดำเนินการทั้งสองส่วนนี้ต้องใช้เวลาพอประมาณทีเดียวครับ ผมจึงต้องขอโทษทุกท่านที่ติดต่อขอฐานข้อมูลดิบของ GotoKnow มา ณ ที่นี้ครับ
[ที่จริงแล้วส่วนที่น่าสนใจมากกว่าการนำฐานข้อมูลดิบของ GotoKnow ออกไปประมวลผลต่อคือการช่วยเราพัฒนาซอฟต์แวร์ KnowledgeVolution ซึ่งเป็นซอฟต์แวร์ที่เราเปิดเผยแบบ open source ให้เกิดการประมวลผลภายในเครื่องแม่ข่ายของ GotoKnow เองเพื่อเพิ่มความสามารถในการช่วยเหลือการใช้งานของผู้ใช้ (อาทิเช่น ให้ค้นพบบันทึกที่น่าสนใจ หรือบุคคลที่น่าสนใจง่ายขึ้น) ด้วยการทำแบบนี้ ผู้วิจัยก็ไม่ต้องใช้ฐานข้อมูลจริงของ GotoKnow แต่สามารถทำการวิจัยในเชิงวิศวกรรมคอมพิวเตอร์ได้ครับ]
แวะมาเรียนรู้
ขอบคุณค่ะ
รักษาสุขภาพนะคะ
เหมาะแล้วครับ เห็นด้วย
ขอชื่นชม อ และเห็นด้วยกับ อ ว่า อ ทำถูกแล้วที่พยายามรักษา trust ที่ผู้ใช้มีให้กับ อ
ขอร่วม share ความฝันของ knowledge society เกิดขึ้นในประเทศไทยอย่างที่อาจารย์วาดไว้ด้วยคนครับ
ถือเป็นการให้เกียรติแก่ผู้ใช้บริการอย่างเราครับ
ขอบคุณมากครับ ;)
สวัสดีค่ะอาจารย์
*** แวะมาบอกว่ารัก G 2 K ค่ะ
สวัสดีค่ะ ดร. ธวัชชัย ปิยะวัฒน์
เห็นด้วยอย่างยิ่งค่ะ
ผู้วิจัยก็น่าจะทราบและเข้าใจในรายละเอียดดังกล่าวดีนะค่ะ ..
รักษาสุขภาพด้วยค่ะ
หนุ่ย
เห็นด้วยกับท่านอาจารย์ค่ะ
เป็นกำลังใจในการสร้างสรรค์กิจกรรมในโลก ICT ค่ะ
ขอบคุณทุกท่านมากสำหรับความคิดเห็นครับ หากมีความคืบหน้าในเรื่องกระบวนการและแนวทางในการเปิดเผยข้อมูลของ GotoKnow เป็น public asset ต่อจากแนวคิดเบื้องต้นนี้นั้น ผมจะมาแจ้งทุกท่านทราบต่อไปครับ
ท่านอาจารย์ธว้ชชัยครับ
เห็นด้วยกับท่านอาจารย์ อย่างยิ่ง
ความไว้วางใจ
ซื้อไม่ได้ ขายไม่ได้
หัวข้อวิจัย ท่านอาจารย์ ได้ชี้ทางสว่างไว้ให้แล้ว
ผมจำคุณาสารินีได้ครับ ยินดีที่คุณสารินีมาเยี่ยมอ่านบันทึกครับ
ขอบคุณสำหรับการพัฒนาระบบและ ถูกใจ จาก facebook ค่ะ