ตอนนี้ใครค้นหาอะไรใน Google ก็มักจะมาเจอเอาบันทึกใน GotoKnow รวมไปถึงพวกคนไม่ดีที่คอยมุ่งใส่ข้อคิดเห็นเพื่อโฆษณาขายของลงในเว็บบอร์ดหรือในบล็อก
เมื่อวาน ดิฉันเขียนตัวอย่าง ข้อคิดเห็นที่เป็น spam มาจากจีน ในบันทึก สืบจับตัวนัก spam ผ่านทางสถิติหน้าเพจ
มาวันนี้ ดิฉันเจอบันทึกที่มีข้อคิดเห็นเป็น spam โดยคนไทย และเมื่อดูจากสถิติหน้าเพจก็ชัดมากว่ามาจาก Google แต่บางอันก็ดูเหมือนจะเป็นการจงใจใส่ข้อคิดเห็น spam ลงในบันทึกโดยตรง ไม่ได้บังเอิญเข้ามาเจอแต่อย่างไร
<h3>วิธีการให้บล็อกปลอดจากข้อคิดเห็นแบบ Spam</h3><ol>
</ol><p>ตัวอย่าง ข้อคิดเห็นแบบ spam จากคนไทยด้วยกันเอง</p><p>ดูจากหน้าสถิติของหน้านั้น พบว่า spammer เจอบันทึกนี้โดยการค้นหาคำว่า กระทู้ จาก google </p><p> </p><p>
</p><p> </p><p> </p><p> </p><p> </p>
วิธีกันมีหลายวิธีครับ
วิธีนึงที่นิยมใช้กันคือ ให้เฉพาะสมาชิกเท่านั้นที่จะลงความเห็นได้
แต่มันก็จำกัดคนภายนอกไม่ให้แสดงวามเห็นเช่นกันครับ
เหนื่อยมากค่ะที่จะสู้กับสแปม
แต่ว่างๆ จะลองดูเหมือนกัน เคยลองดูแบบนักกฎหมายนะคะ แต่มันดูไม่เข้าท่า เลยพักเอาไว้ก่อน
ลองอ่านงานของเราเกี่ยวกับสแปมไหมคะ
http://www.archanwell.org/autopage/show_page.php?t=2&s_id=46&d_id=50
อย่าหัวเราะเยาะกันนะคะ
ขอขอบพระคุณอาจารย์จันทวรรณ...
archarnwell ค่ะ โดยส่วนใหญ่แล้ว "คน" ที่ใส่ spam comment เพื่อการโฆษณาสินค้า จะถูกจ้างมาอีกทีจากบริษัทที่รับโฆษณาสินค้าให้ทาง Internet ค่ะ ดังนั้น เจ้าของ email address หรือ เบอร์โทรศัพท์ที่อยู่ใน spam comment อาจจะไม่รู้เรื่องเลยว่า มีคนนำเอาข้อความโฆษณามา post ลงในบล็อก หรือ ในเว็บบอร์ดที่ไม่ตรงกับวัตถุประสงค์ของโฆษณา
คนที่ว่าจ้างบริษัทโฆษณามักจะจ่ายเงินไปเป็นงวดค่ะ แล้วบริษัทโฆษณาก็จะทำการสัญญาว่าจะทำให้สินค้าหรือร้านค้าเป็นที่รู้จักภายในกี่เดือนก็ว่ากันไปค่ะ แต่บริษัทโฆษณาราคาถูกที่ไม่มีจรรยาบรรณก็มีอยู่เยอะ และก็จะว่าจ้างนักศึกษาหรือคนทั่วไปไปทำการ post spam comment ลงในบล็อก หรือ เว็บบอร์ดโดยไม่สนใจว่าจะเป็นขยะหรือไม่
ส่วนเรื่องการ post spam comment อัตโนมัติโดยตัว bot หรือ program ก็ต้องต่อกรกันด้วยเทคโนโลยีค่ะ เช่น ใช้ antispam graphic อย่างที่เห็นในหลายที่ และใน GotoKnow ค่ะ อาจารย์วิบุล ได้ให้ความเห็นในเรื่องนี้ไว้ดีมากค่ะ http://gotoknow.org/blog/wwibul/42622 และ http://gotoknow.org/blog/wwibul/40340
ผมกังวลอยู่เรื่องนึงครับ จะมีบาง blog ที่เปิดเล่น ๆ แล้วไม่คิดมาดูแล จะเป็นมุมอับของระบบ
ถ้ามี spam แปะมาใน blog แบบนี้ค้างอยู่แม้แต่แห่งเดียว อาจทำให้ G2K กลายเป็นเป้าของฝูง spam ทันที (ผมมีความเชื่อส่วนตัวว่าพวกนี้มีกลไกการเหนี่ยวนำให้เข้ามาโจมตี)
ผมขอเสนอว่าอาจต้องพัฒนา script ทำ content analysis เพื่อลบทุกกระทู้ที่มี link density สูงผิดปรกติ (หรือมีคำต้องห้าม) หรืออย่างน้อย ต้องมีระบบ'กาปูนแดง'อัตโนมัติเพื่อรอการตรวจสอบและลบด้วยมือ
เรื่องตัวอักษระวังหน่อยก็ดีครับ
เช่นตัว I กับ l
ถามว่าคืดตัวอะไรครับ
I ตัวแรกคือตัวไอใหญ่
l ตัวที่สองคือแอลเล็ก
ขอเสนอให้ใช้เฉพาะชุดต่อไปนี้
+-*/123456789;<=>@
ABCDEFGHJKLMNOPQRSTUVWXYZ
abcdefhjkmnrstwxyz
๑๒๓๔๕๖๗๘๙
จะได้ไม่สับสน
เอ..แบบนี้ดีกว่าไหม
+-*123456789;=@<>[]{}()
ABCDEFGHJKLMNOPQRSTUVWXYZ
abcdefhjkmnrstwxyz
๑๒๓๖๗๘๙
ตัดทิ้งไปไม่น้อย แต่ที่เหลือน่าจะมองเห็นชัด