มีเรื่องน่าสนใจเกิดขึ้นในระหว่างการวิเคราะห์สถิติการเข้าชม Gotoknow เพื่อพยายามทำให้ Gotoknow ตอบสนองต่อการเรียกดูหน้าต่างๆ ได้เร็วยิ่งขึ้น

ข้อมูลนี้อาจารย์จันทวรรณและอาจารย์ธวัชชัย ได้กรุณาให้ผมเข้าไปดูสถิติบางอย่างได้ครับ ขอขอบคุณมา ณ ที่นี้ด้วยครับที่ให้โอกาส ข้อมูลเกี่ยวกับพฤติกรรมการเรียกดูหน้าต่างๆ ได้ส่งถึงอาจารย์เรียบร้อยแล้ว 

แต่ผลพลอยได้นอกเหนือจากวัตถุประสงค์หลักนี้ ก็ยังน่าสนใจอยู่ดี 

หน้าที่ร้อนแรงที่สุดใน Gotoknow คือหน้าแรก /home -- ในร้อยอันดับแรก พบพฤติกรรมหลากหลายในการเข้าดูหน้าต่างๆ ทั้งอ่านจากแพลนเน็ต อ่านจากบล๊อก bookmark อ่านจาก RSS หรือเชื่อมโยงมาจากเว็บอื่น แล้วแต่สมาชิกแต่ละท่าน ชอบ/คุ้นเคยกับวิธีการใด

แต่สถิติที่น่าสนใจที่สุดคือความถี่ของการเรียกดูบล๊อก; เรื่องนี้น่าสนใจเพราะนี่คือความพยายามที่จะเข้าใจแนวทางการเขียนของเจ้าของบล๊อก (ทั้งจากชื่อบันทึก+เนื้อหาตอนต้นบองบันทึกทั้ง 10 บันทึกที่ปรากฏในหน้าแรกของบล๊อก ทั้งข้อมูลของเจ้าของบล๊อก ทั้ง[เกี่ยวกับบล๊อกนี้] ทั้ง[เครื่องมือ]) และรวมทั้งการใช้ URL ในรูปแบบ http://ชื่อบล๊อก.gotoknow.org ซึ่งจะถูก redirect ไปยังบล๊อก http://gotoknow.org/blog/ชื่อบล๊อก

หลังจากได้ปรึกษากับอาจารย์ธวัชชัยเมื่อคืนก่อนนี้แล้ว ผมขอนำสถิติต่างๆ มาเปิดเผยไว้ที่นี่ เรียงลำดับตามที่ Truehits ตรวจวัดได้ แต่จะยังไม่เปิดเผยเดือนล่าสุดเพื่อไม่ให้เป็นแรงจูงใจในการปั่นสถิติ จนทำให้ระบบช้าลงโดยไม่จำเป็น และไม่เปิดเผยความห่างระหว่างแต่ละอันดับ

เดือน Pageviews Unique IPs
มกราคม 2550 1,896,933 228,116
กุมภาพันธ์ 2550 2,068,880 239,733
มีนาคม 2550
2,114,599 235,068
เมษายน 2550 2,166,839 251,795

Top 15 บล๊อกที่ปรากฏชื่อใน Top 100 URL เรียงลำดับจากมากไปน้อยสำหรับแต่ละเดือน

มกราคม 2550 กุมภาพันธ์ 2550 มีนาคม 2550 เมษายน 2550
tutorial feriona4 thaikm thaikm
phand
Ken-Mproject (ปิดแล้ว)
phand phand
Ken-Mproject (ปิดแล้ว) tonliew (ปิดแล้ว)
classroomresearch A-b-c
thaikm thaikm
beutifulmemories beingaboss
feriona4
phand
beyondkm health2you
officekm
tutorial panyapiwat beyondkm
tonliew (ปิดแล้ว) flash health2you beutifulmemories
Project (ปิดแล้ว) nfepadrew beingaboss ariyachon
chirakm
officekm pichaik sutthinun
beyondkm
TULIBs mrschuai president
pattaradech (ปิดแล้ว)
beyondkm Ken-Mproject (ปิดแล้ว)
goodliving
dmindmap
pichaik sutthinun pichaik
sawaengkku
phoenix-mirror chill-chill dmindmap
k-sharing
beutifulmemories dmindmap random
มีเพียง 14 บล๊อก
ใน Top 100 URL
k-jira paiboon paiboon
  มีอีก 1 บล๊อก
ใน Top 100 URL
มีอีก 8 บล๊อก
ใน Top 100 URL
มีอีก 2 บล๊อก
ใน Top 100 URL

ประเด็นจากตารางนี้มีอย่างนี้ครับ

  • ข้อมูลมาจาก Truehits ซึ่งเป็นกลางและมีวิธีการตัด crawler ออกไป (นับให้เฉพาะการเปิดดูจาก browser ที่สนับสนุน JavaScript)
  • อย่าสนใจเรื่องอันดับมากไปกว่าการศึกษาวิธีการ ว่าสมาชิกซึ่งเขียนบล๊อกที่ได้รับความนิยม สื่อสารอะไรกับบรรดาสมาชิกอื่น; ผมเห็นว่าแต่ละท่านมีสไตล์เป็นของตัวเอง เขียนในเรื่องที่ตนรู้ มีประโยชน์ และมีความรักในสิ่งนั้น จึงมีผู้ติดตามมาก -- แต่บางที จำนวนผู้อ่าน กลับไม่สำคัญเท่ากับที่ท่านได้อะไรจากบันทึกและความคิดเห็นท้ายบันทึกเหล่านั้น -- อันดับเปลี่ยนแปลงไปมา ตามคุณค่า่และประเด็นของบันทึก ตามความถี่ในการเขียนบันทึก และตามความสนใจของสมาชิกในแต่ละช่วงเวลา
  • อย่าถามผมเลยว่า บางบล๊อกเห็นมีไม่กี่บันทึก มาติดอยู่ในอันดับได้อย่างไร; ข้อมูลนี้มาจากการวัดของ Truehits ผมเพียงแต่เอามารายงาน ตามผลการวัดที่ปรากฏ
  • น่าสงสัยว่าทำไมบล๊อกเกอร์ยอดนิยมหลายท่าน จึงไม่อยู่ในอันดับ; เรื่องนี้เรียนอย่างนี้ครับ การอ่านบล๊อกมีหลายวิธี บล๊อกเกอร์ยอดนิยมที่เขียนได้โดนใจผู้อ่าน มักจะถูกรับบล๊อกนั้นเข้าแพลนเน็ต ซึ่งการอ่านผ่านแพลนเน็ตไม่ปรากฏในสถิตินี้
  • การอ่านผ่านแพลนเน็ต จะปรากฏต่อ Truehits เสมือนเป็นการอ่านบันทึกโดยตรง จึงไม่รวมอยู่ในตารางนี้ (เนื่องจากไม่มีนัยสำคัญทางสถิติที่เพียงพอ กระจายมากจนสรุปอะไรไม่ได้)
  • การนับจำนวนครั้งที่อ่านของ Gotoknow (hit meter สำหรับแต่ละบันทึก) มีความแน่นอนที่สุด ปั่นยาก และป้องกันการนับซ้ำๆกันได้ดี จึงน่าจะมีความถูกต้องมากกว่าการติด hit meter อื่นๆ; การวิเคราะห์สถิติจาก hit meter ของ Gotoknow ยังอยู่ในคิวการพัฒนา เชื่อว่าจะได้ภาพอีกภาพหนึ่ง ซึ่งน่าสนใจในมุมของความนิยมที่แท้จริงของบล๊อกเกอร์
  • ตารางบน แสดงให้เห็นแนวโน้มที่ชัดเจนว่า Gotoknow ได้รับความนิยมมากขึ้นเรื่อยๆ และเป็นภาระหนักของทีมพัฒนาและทีมผู้ประสานงาน; เครื่องแม่ข่ายของ Gotoknow ส่งข้อมูลออกไปด้วยอัตรากว่า 50 หน้าต่อนาที ตลอดเวลา ในแต่ละหน้า ประกอบไปด้วยตัวหนังสือและ icon เล็กๆ มากมาย จึงทำให้ระบบทำงานหนักมาก เช่นการเรียกดูหรือ refresh หน้าแรกแต่ละครั้ง เครื่องแม่ข่ายจะต้องส่งข้อมูลให้ browser 72 ครั้ง (html หลัก 1 ครั้ง stylesheet 3 ครั้ง และ icon+รูปภาพ อีก 68 ครั้ง); ด้วยอัตรานี้ เครื่องแม่ข่ายรับ http GET ด้วยอัตรา 60 ครั้งต่อวินาที ซึ่งเป็นภาระที่หนักมาก
  • ดังนั้น เพื่อประโยชน์ของสมาชิก Gotoknow ทั้งหมด ขอความกรุณาอย่า refresh browser โดยไม่จำเป็น หลีกเลี่ยงการปั่นสถิติโดยเด็ดขาด
  • สมาชิกสามารถจะทราบได้เกือบทันทีเมื่อมีผู้มาให้ความคิดเห็นเพิ่มเติมในบันทึก โดยการระบุอีเมลให้ถูกต้อง ซึ่ง Gotoknow จะส่งอีเมลไปแจ้งโดยอัตโนมัติ ในทันทีที่เกิดความคิดเห็นใหม่ขึ้น ไม่ว่าบันทึกนั้นจะเกิดขึ้นนานแล้วเพียงใด; วิธีการนี้ ดีต่อการตอบสนองของ Gotoknow มากกว่าการ refresh บล๊อก