completely automated public Turing test to tell computers and humans apart
CAPTCHA คือ เทคนิคที่ใช้ในการตรวจสอบว่าเป็นความเป็นมนุษย์ (ไม่ใช่คอมพิวเตอร์) โดยใช้วิธีการให้บอกตัวอักษร โดยที่ตัวอักษรมีการทำให้ผิดรูปทรง หรืออาจมีฉากหลัง (background) ทั้งนี้ เพื่อป้องกันการใช้คอมพิวเตอร์ในการประมวลผลภาพ(image processing)
เพราะคอมพิวเตอร์ คิดไม่ได้ ไม่มีจินตนาการ จึงต้องใช้ประมวลผลภาพ และความน่าจะเป็น
บทความ Defeating Digg’s CAPTCHA ได้แสดงถึงการประมวลผล โดยใช้จุดอ่อนของ CAPTCHA ดังนี้
1. Dictionary Words
2. Same background
3. Same Font
4. No deformations
5. All lowercase letters
5. Constant colors
นอกจากนั้นยังทำการปรับแต่งภาพ จาก เป็น ซึ่งจะง่ายต่อการ OCR
(Optical character recognition)
ตัวอย่างจากโปรแกรม aiCaptcha
มีผู้พัฒนา pwntcha.com (Pretend We’re Not a Turing Computer but a Human Antagonist) เพื่อทำการวิจัยในการ captcha decode มาลองดูตัวอย่างกันครับ ส่วนรายละเอียดเพิ่มเติม ดูได้ที่ http://sam.zoy.org/pwntcha/
ต่อไปนี้จะยกตัวอย่างเพียงบางส่วน...
ตัวอย่าง CAPTCHA ที่ไม่ดี
100% ใช้ใน Authimage
100% ของ Clubic
100% ในเว็บ linuxfr.org
100% เว็บ Ourcolony
88% ของ Paypal ปัจจุบันน่าจะเปลี่ยนแล้ว
99% LiveJournal
98% lmt.lv
ตัวอย่าง CAPTCHA ที่ดี
ของ MSN Passport นี่เอง อย่าว่าแต่คอมพิวเตอร์เลย คนยังอ่านแล้ว มึนๆ!
ของ Yahoo อ่านง่าย มีการใช้ เส้น ทำให้คอมพิวเตอร์ เกิดความสับสน
Breaking CAPTCHA project!
pwntcha
gimpy - Breaking a Visual CAPTCHA
aiCaptcha
Links
The CAPTCHA Project
Detecting Boundaries in Natural Images by charless fowlkes
Shape Matching and Object Recognition
UC Berkeley Computer Vision Group
ได้ประโยชน์มากครับ
เรื่องนี้น่าขยายความนะครับ