ผมสนใจ การจัดระเบียบหมวดหมู่ขององค์ความรู้ และ การจัดหมวดหมู่เนื้อหาของเอกสาร (document classification) ซึ่งแน่นอนว่าเป็นเทคโนโลยีที่ต้องใช้ thesaurus, taxonomy, ontology ตามแนวทาง semantic web
เท่าที่ผมเคยทราบมาก่อน การสร้าง คำคลัง (thesaurus) เป็นพื้นฐานในการสร้าง อนุกรมวิธาน (taxonomy) ของศัพท์ ซึ่งก็เป็นพื้นฐานในการสร้าง ออนโทโลยี หรือ ภววิทยา (ontology) เพื่อการจัดระเบียบลำดับของสรรพสิ่ง (ที่เรารับรู้ ตลอดจน คอมพิวเตอร์ และ AI รับรู้)
เมื่อเร็วๆ นี้ ผมอยากทราบว่า ถ้าเราจะสร้าง taxonomy ขึ้นมาใช้งาน มีหลักการและข้อพิจารณาในการสร้างอย่างไรบ้าง ผมไปพบ บล็อกของ Heather Hedden ว่าด้วย taxonomy building steps ที่ http://accidental-taxonomist.blogspot.com/2019/02/taxonomy-building-steps.html
ซึ่งเป็นผู้เขียนหนังสือ The Accidental Taxonomist และเธอได้ให้คำแนะนำสังเขปในการสร้างอนุกรมวิธานไว้ให้ในบล็อกของเธอ ผมเห็นว่ามีประโยชน์มากต่อ(ตัวผมเอง) และ คน ๒ กลุ่มที่ต้องใช้งานสารสนเทศหรือสืบค้นเอกสารออนไลน์
ผมสรุปขั้นตอนสร้างอนุกรมวิธานที่เธอได้แนะนำไว้ให้ โดยขยายความ และเรียบเรียงใหม่ให้ชัดเจนขึ้นดังนี้
a) Info gathering. ขั้นตอนการเก็บข้อมูลเพื่อเตรียมสร้างอนุกรมวิธาน เธอเสนอว่า มี ๒ ด้าน. ให้ผู้ที่ต้องการจะสร้างอนุกรมวิธานขึ้นเองมอง โดยทางหนึ่งให้อิงเอกสารเป็นหลัก และอีกด้านหนึ่งให้อิงผู้ใช้งานเป็นหลัก
Info & document side Samples of content รวบรวมตัวอย่างเนื้อหาที่ต้องการจะจัดกลุ่ม How would they be classified by higher level of content, document type, specific indexing terms, พิจารณาว่าจะจัดเอกสารโดย (ก) ดูที่ abstraction เนื้อหาระดับภาพรวมหรือขอบเขตขนาดใหญ่ (ข) จัดโดยอิงประเภทเอกสาร (แฟ้ม มีเดีย ฯลฯ) (ค) คำหลัก (keywords) ที่จะใช้ทำดัชนี
User side. ในการมองด้านผู้ใช้งาน อันที่จริงก็ยังแบ่งได้เป็น ๒ กลุ่มใหญ่อีกคือ
Information seeking users, กลุ่มผู้ค้นหาเนื้อหาหรือเอกสาร ให้ดูพฤติกรรมและวิธีที่พวกเขาใช้ค้นหาข้อมูล ว่าเขาค้นแบบไหน behaviors of primary user groups, to find desired contents
Uploading content users กลุ่มผู้สร้างเนื้อหา หรือ ผู้สร้างเอกสาร ซึ่งคนกลุ่มนี้มองหาวิธีที่จะติดป้ายชื่อเพื่อจำแนกประเภทเอกสารของตนอยู่ เพื่อช่วยในการค้นคืนเอกสารในอนาคต ว่าจะใช้คำไหนในการสืบค้นบ้าง> look for suitable terms to tag their content
b) Draft design and building ขั้นตอนออกแบบร่าง และ การสร้าง High level design. การออกแบบในระดับบน Metadata spec การออกข้อกำหนด เมตะดาต้า Taxonomy types: hierarchical, faceted, mixed ชนิดของอนุกรมวิธาน ว่าจะจัดแบบ ตามลำดับชั้น หรือ จัดตาม จัดตามแง่มุมของสาขาวิชาหรือของขอบเขตที่สนใจ หรือ จัดแบบผสม Approach direction: top down, bottom up, both แนวทางการสร้าง จะเป็นแบบ สร้างข้างบนลงมา (จากหัวข้อใหญ่ก่อนลงมาหัวข้อปลีกย่อย) หรือ สร้างจากข้างล่างขึ้นไป
c) Review / Testing / Validation / Revision ขั้นตอนการทบทวน ทดสอบ พิสูจน์ แก้ไขปรับปรุง
d) Governance / Maintenance plan drafting ขั้นตอนการดูแล ร่างระเบียบการบำรุงรักษาอนุกรมวิธาน Editorial policy / guidelines / use / tagging policy นโยบายเชิงบรรณาธิกรณ์ ข้อกำหนดวิธีการบำรุงรักษาปรับปรุงอนุกรมวิธาน แนวทางในการใช้งาน และ นโยบายการติดป้ายชื่อคำหลักเพื่อระบุเอกสาร (ของหน่วยงาน)
ผมพบว่า เมื่อผมใช้ตัวเลขระบุหัวข้อ ระบบของ gotoknow ใส่ตัวเลขเข้ามา override ตัวเลขของผม ทำให้เลขหัวข้อผมเปลี่ยนไป ข้อความดูวุ่นวาย เลยเปลี่ยนมาเป็นตัวอักษร a) b) c) d) แทน (เผื่อ อาจารย์ผู้ดูระบบผ่านมาอ่านเจอนะครับ)