แนวคิดเบื้องต้นในการเปิดเผยฐานข้อมูลดิบ (database) ของ GotoKnow

ในช่วงวันหยุดที่ผ่านมาได้มีนักศึกษาระดับปริญญาโทสาขาวิศวกรรมคอมพิวเตอร์ท่านหนึ่งได้ติดต่อขอฐานข้อมูลดิบ (database) ของ GotoKnow เพื่อใช้ในการทำวิทยานิพนธ์ ผมได้ตอบอีเมลนักศึกษาท่านนั้น แล้วจึงขอนำมาเรียบเรียงเป็นบันทึกไว้ที่นี่ครับ

กระบวนการในการจะเปิดเผย database ของ GotoKnow นั้นต้องใช้เวลาและเป็นกระบวนการทางสังคมเนื่องจากเกี่ยวพันถึงความไว้วางใจ (trust) ของชุมชนผู้ใช้ที่ใช้บริการของเราครับ แม้ว่าเราจะบอกว่าเอา fields ตามที่ผู้วิจัยบอกว่าไม่เกี่ยวข้องออกแล้วก็ตามก็ไม่ได้หมายความว่าการเปิดเผยข้อมูลนั้นจะได้รับอนุญาตจากชุมชนครับ เพราะมีกระบวนการอีกมากในการเอาข้อมูลนี้ไปประมวลผลต่อ อาทิเช่น ถ้าฐานข้อมูลนี้หลุดไปในมือของนักการตลาดของบริษัทใดบริษัทหนึ่ง อาจใช้ data mining algorithms บางอย่างเพื่อหาค่าอะไรบางอย่างจากเนื้อหาแล้วเอาผลลัพธ์นั้นไปรบกวนผู้ใช้ได้ เป็นต้นครับ

งานวิจัยของ UsableLabs เป็นเรื่อง Human-Computer Interaction ครับ เรื่องสำคัญด้าน HCI ที่เราปฎิบัติอย่างต่อเนื่องและเข้มข้นในการบริหารจัดการเว็บไซต์อย่าง GotoKnow คือ "ความไว้วางใจ" (trust) ที่ผู้ใช้มีต่อระบบครับ การให้ฐานข้อมูลดิบของแก่บุคคลใดบุคคลหนึ่งโดยไม่ได้ปรึกษาและได้ความยินยอมจากชุมชนผู้ใช้จะเป็นการทำลายความไว้เนื้อเชื่อใจที่ผู้ใช้มีต่อเราอย่างสิ้นเชิงครับ

อย่างไรก็ตามเรามีแผนการเปิดเผย database ของ GotoKnow เป็น public asset ดังเช่นที่ Wikipedia ทำ เพราะนั่นคือเป้าหมายสูงสุดของเราในการสร้างเว็บไซต์ GotoKnow เพราะอีกหลายสิบปีหลายร้อยปีหลังจากนี้ สิ่งที่อยู่ใน database ของ GotoKnow จะเป็นบันทึกประวัติศาสตร์ที่สำคัญอย่างยิ่งชิ้นหนึ่งของประเทศไทยครับ

งานอีกส่วนหนึ่งที่ UsableLabs ทำคือ Digital Anthropology ครับ เรื่องนี้เป็นอีกเรื่องที่สำคัญมาก ประวัติศาสตร์ของประเทศไทยได้สูญหายไปเป็นจำนวนมากตั้งแต่เราเริ่มมีเทคโนโลยีเว็บ ไม่น่าเชื่อแต่เป็นความจริงครับ อาทิเช่น เนื้อหาของเว็บไซต์ของรัฐสภาในการร่างกฎหมายครั้งล่าสุดนั้น ถ้าค้นหาตอนนี้แม้จะพอหาได้จาก Archive.org แต่ก็ไม่สมบูรณ์อย่างยิ่ง (นี่คือสาเหตุที่ UsableLabs มีโครงการ Archive.in.th รอดำเนินการอยู่)

แม้เราจะตั้งเป้าหมายในการเปิดเผยฐานข้อมูลดิบของ GotoKnow ในอนาคตแต่กระบวนการนั้นต้องอาศัยการประมวลผลและความยินยอมจากผู้ใช้ครับ เราได้เริ่มดำเนินการนี้แล้วสังเกตได้ว่าเราเริ่มมีส่วนให้เลือก license ของเนื้อหาในช่วงที่ผ่านมาครับ ซึ่งเราจะดำเนินการต่อไปตามลำดับแต่ต้องใช้เวลาและความรอบคอบอย่างยิ่งครับ

การเปิดเผย database นี้ต้องผ่านกลไกสองอย่างเพื่อรักษาความไว้วางใจของผู้ใช้ที่มีต่อระบบครับ

  1. ต้องได้รับความยินยอมจากผู้ใช้ โดยผ่านประชาสัมพันธ์อย่างต่อเนื่อง จนแน่ใจได้ว่ามีการพิจารณาแล้วจากผู้ใช้ที่จะยอมให้มีการเปิดเผยข้อมูลที่ตัวเองเขียนในรูปแบบที่สามารถนำไปประมวลผลต่อได้โดยง่าย
  2. ต้องเปิดเผยต่อสาธารณชนพร้อมๆ กันให้ทุกคนสามารถนำข้อมูลไปประมวลผลต่อได้อย่างเท่าเทียมกัน โดยเป็นฐานข้อมูลสาธารณะ ไม่ใช่เปิดเผยแก่บุคคลใดบุคคลหนึ่งครับ

ในการดำเนินการทั้งสองส่วนนี้ต้องใช้เวลาพอประมาณทีเดียวครับ ผมจึงต้องขอโทษทุกท่านที่ติดต่อขอฐานข้อมูลดิบของ GotoKnow มา ณ ที่นี้ครับ

[ที่จริงแล้วส่วนที่น่าสนใจมากกว่าการนำฐานข้อมูลดิบของ GotoKnow ออกไปประมวลผลต่อคือการช่วยเราพัฒนาซอฟต์แวร์ KnowledgeVolution ซึ่งเป็นซอฟต์แวร์ที่เราเปิดเผยแบบ open source ให้เกิดการประมวลผลภายในเครื่องแม่ข่ายของ GotoKnow เองเพื่อเพิ่มความสามารถในการช่วยเหลือการใช้งานของผู้ใช้ (อาทิเช่น ให้ค้นพบบันทึกที่น่าสนใจ หรือบุคคลที่น่าสนใจง่ายขึ้น) ด้วยการทำแบบนี้ ผู้วิจัยก็ไม่ต้องใช้ฐานข้อมูลจริงของ GotoKnow แต่สามารถทำการวิจัยในเชิงวิศวกรรมคอมพิวเตอร์ได้ครับ]

บันทึกนี้เขียนที่ GotoKnow โดย  ใน คนเขียนโค้ด



ความเห็น (13)

แวะมาเรียนรู้

ขอบคุณค่ะ

รักษาสุขภาพนะคะ

เหมาะแล้วครับ เห็นด้วย

ขอชื่นชม อ และเห็นด้วยกับ อ ว่า อ ทำถูกแล้วที่พยายามรักษา trust ที่ผู้ใช้มีให้กับ อ

เขียนเมื่อ 

ขอร่วม share ความฝันของ knowledge society เกิดขึ้นในประเทศไทยอย่างที่อาจารย์วาดไว้ด้วยคนครับ

เขียนเมื่อ 

ถือเป็นการให้เกียรติแก่ผู้ใช้บริการอย่างเราครับ

ขอบคุณมากครับ ;)

สวัสดีค่ะอาจารย์

*** แวะมาบอกว่ารัก G 2 K ค่ะ

เขียนเมื่อ 

สวัสดีค่ะ ดร. ธวัชชัย ปิยะวัฒน์

เห็นด้วยอย่างยิ่งค่ะ

ผู้วิจัยก็น่าจะทราบและเข้าใจในรายละเอียดดังกล่าวดีนะค่ะ ..

รักษาสุขภาพด้วยค่ะ

หนุ่ย

ครูพิษณุโลก
IP: xxx.25.199.163
เขียนเมื่อ 

เห็นด้วยกับท่านอาจารย์ค่ะ

เป็นกำลังใจในการสร้างสรรค์กิจกรรมในโลก ICT ค่ะ

ขอบคุณทุกท่านมากสำหรับความคิดเห็นครับ หากมีความคืบหน้าในเรื่องกระบวนการและแนวทางในการเปิดเผยข้อมูลของ GotoKnow เป็น public asset ต่อจากแนวคิดเบื้องต้นนี้นั้น ผมจะมาแจ้งทุกท่านทราบต่อไปครับ

ท่านอาจารย์ธว้ชชัยครับ

เห็นด้วยกับท่านอาจารย์ อย่างยิ่ง

ความไว้วางใจ

ซื้อไม่ได้ ขายไม่ได้

หัวข้อวิจัย ท่านอาจารย์ ได้ชี้ทางสว่างไว้ให้แล้ว

  • สวัสดีค่ะอาจารย์ธวัชชัย
  • มาเยี่ยมอาจารย์ และมาขอความรู้ด้วยค่ะ
  • ไม่รู้ยังจำกันได้ป่าว....อิอิอิ
  • อาจารย์สบายดีไหมค่ะ
  • คิดถึงค่ะ

   

ผมจำคุณาสารินีได้ครับ ยินดีที่คุณสารินีมาเยี่ยมอ่านบันทึกครับ

เขียนเมื่อ 

ขอบคุณสำหรับการพัฒนาระบบและ ถูกใจ จาก facebook ค่ะ