เรื่องเริ่มต้นตอนผมเขียน Spam Test-Kit แบบบ้าน ๆ  ในวง share.psu.ac.th เล่าว่า เรามีวิธีสร้างระบบตรวจจับปัญหาช่องโหว่การโพสท์เนื้อหาไม่เหมาะสมเข้าในเว็บที่เราเกี่ยวข้องอยู่ ได้อย่างไร


ทำให้นึกขึ้นได้ว่า search engine อย่าง google นี้ อาจช่วยให้เราสร้างตัวชี้วัด ให้เราก้าวไปถึงขั้น เว็บหกดาว  ได้อย่างไร

สรุปสั้น ๆ วิธีคือ ใช้ google ค้นวลีที่เป็นสแปมยอดนิยม (ดูในรูป - ผมจะไม่พิมพ์วลีดังกล่าวเป็นข้อความไว้ จะได้ไม่ทำให้ gotoknow โดนปนเปื้อนไปด้วย) เจาะแต่ในโดเมนที่สนใจ

รายละเอียดยาวกว่านี้ ลองไปอ่านตาม link ที่ใส่ไว้เองนะครับ

ผมเปรียบเทียบโดเมน .or.th, .co.th, .ac.th และ .go.th ได้ผลดังภาพที่แสดงไว้

หน้าเว็บไหน มีวลีดังกล่าว (ชื่อยาที่โฆษณาขายผ่านเว็บ) แสดงว่า โดนสแปมปนเปื้อนไปเรียบร้อย

 

ข้อสรุปน่าสนใจครับ

.or.th (organization domain) สะอาดกว่าเพื่อน

แต่ .co.th (commercial domain) ก็จี้ติด ๆ ตามมา พร้อม .ac.th (academic domain) แบบติด ๆ เส้นยาแดงผ่าแปด

แต่ .go.th (government domain) ดูเหมือนจะถูกปล่อยทิ้งไว้แบบไม่ใส่ใจ มีสแปมเข้มข้นแพร่ไปรุนแรงกว่าโดเมนอื่น (วัดตาม % ที่ปนเปื้อน) ถึง 15 เท่า