completely automated public Turing test to tell computers and humans apart


user posted image
CAPTCHA คือ เทคนิคที่ใช้ในการตรวจสอบว่าเป็นความเป็นมนุษย์ (ไม่ใช่คอมพิวเตอร์) โดยใช้วิธีการให้บอกตัวอักษร โดยที่ตัวอักษรมีการทำให้ผิดรูปทรง หรืออาจมีฉากหลัง (background) ทั้งนี้ เพื่อป้องกันการใช้คอมพิวเตอร์ในการประมวลผลภาพ(image processing)

เพราะคอมพิวเตอร์ คิดไม่ได้ ไม่มีจินตนาการ จึงต้องใช้ประมวลผลภาพ และความน่าจะเป็น

บทความ Defeating Digg’s CAPTCHA ได้แสดงถึงการประมวลผล โดยใช้จุดอ่อนของ CAPTCHA ดังนี้

1. Dictionary Words
2. Same background
3. Same Font
4. No deformations
5. All lowercase letters
5. Constant colors

นอกจากนั้นยังทำการปรับแต่งภาพ จาก user posted image เป็น user posted image ซึ่งจะง่ายต่อการ OCR
(Optical character recognition)


ตัวอย่างจากโปรแกรม aiCaptcha
user posted image



มีผู้พัฒนา pwntcha.com (Pretend We’re Not a Turing Computer but a Human Antagonist) เพื่อทำการวิจัยในการ captcha decode มาลองดูตัวอย่างกันครับ ส่วนรายละเอียดเพิ่มเติม ดูได้ที่ http://sam.zoy.org/pwntcha/

ต่อไปนี้จะยกตัวอย่างเพียงบางส่วน...

ตัวอย่าง CAPTCHA ที่ไม่ดี
user posted image 100% ใช้ใน Authimage
user posted image 100% ของ Clubic
user posted image 100% ในเว็บ linuxfr.org
user posted image 100% เว็บ Ourcolony
user posted image 88% ของ Paypal ปัจจุบันน่าจะเปลี่ยนแล้ว
user posted image 99% LiveJournal
user posted image 98% lmt.lv



ตัวอย่าง CAPTCHA ที่ดี
user posted image ของ MSN Passport นี่เอง อย่าว่าแต่คอมพิวเตอร์เลย คนยังอ่านแล้ว มึนๆ!
user posted image ของ Yahoo อ่านง่าย มีการใช้ เส้น ทำให้คอมพิวเตอร์ เกิดความสับสน



Breaking CAPTCHA project!
pwntcha
gimpy - Breaking a Visual CAPTCHA
aiCaptcha


Links
The CAPTCHA Project
Detecting Boundaries in Natural Images by charless fowlkes
Shape Matching and Object Recognition
UC Berkeley Computer Vision Group