עוד מחשבות על Captcha

מנגנון Captcha אמור לעמוד בשלוש המשימות הבאות:
אדם צריך לדעת את התשובה הנכונה בקלות.
מחשב צריך להתקשות מאד בגילוי התשובה מתוך השאלה.
מחשב צריך להיות מסוגל לחבר את השאלה בקלות מתוך התשובה.


עד עכשיו מנגנונים אלה התמקדו בתחום הקשה ביותר למחשבים וקל לאנשים - זיהוי תמונות. בין אם זה Captcha בסיסי שדורש ממך לזהות אותיות או אם זה משהו מחוייך יותר - זהה את החתולים מתוך תמונות של חתולים וכלבים או אפילו שילוב של שאלות ציניות וסרקסטיות כמו "זהה את היצור האינטליגנטי ביותר בתמונה" (תמונה שכללה צב, דולפין, מדוזה ואת נשיא ארצות הברית ג'ורג' בוש).

אבל מנגנוני זיהוי אינם חייבים להיות מבוססים על תמונה. למשל אדם מבחין בקלות איזה מהמשפטים הבאים אינו נכון:
העט בתוך התיק.
התיק בתוך העט.
אדם גם מסוגל לגלות את יוצא הדופן:
מחברת, ספר, עיתון, תפוז

הדוגמאות האלה מתיחסות להבנתנו את העולם. משהו שאנחנו יודעים אבל מחשבים לא. הבעיה בשימוש במנגנונים כאלה היא שגם חיבור השאלה צריך להעשות על ידי אדם. מחשב יכול ליצור בקלות תמונה של אותיות אקראיות אבל לא יכול לייצר את השאלה "מי נובח ולא נושך?"

מנגנון ייצור שאלות עשוי להיות משהו מעניין. למשל יתכן שמחשב יכול לסרוק לבדו קבצי טקסט באתר מסויים ולבנות מהן שאלות. המחשב המקודד את השאלה בונה על העובדה שהמשפט נכון, המחשב המפענח אינו יכול לסרוק עכשיו את כל האינטרנט רק כדי למצוא את המידע החסר.
השאלה הגדולה היא איך לעזזאל מבינים - מי מהמשפטים מתאים ליצירת שאלה ואיזו מילה כדאי להשמיט בו.

ננסה ככה (השלם את החסר):
מי מהמשפטים _____ ליצירת שאלה ואיזו מילה כדאי להשמיט בו.
מי מהמשפטים מתאים ליצירת ____ ואיזו מילה כדאי להשמיט בו.
מי מהמשפטים מתאים ליצירת שאלה ואיזו ____ כדאי להשמיט בו.
מי מהמשפטים מתאים ליצירת שאלה ואיזו מילה כדאי ______ בו.
אפשר בקלות לראות שהמשפט הזה אינו משפט נוח כמו המשפט "כלב ____ לא נושך". והבעיה במשפט השני היא שהתשובה נמצאת בגוגל בחיפוש כזה (קליק).

אין לי תשובות לזה, עדיין לא בכל אופן. אני שונא את מנגנון ה Captcha ואשמח לשמוע רעיונות בנושא.

אבל גם במנגנוני Captcha לא חייבים ללכת על אותיות. מנגנון הפוך יבקש מהמשתמש לזהות תמונות על פי מילים, בדומה לזיהוי החתולים. למשל כך -

בחר - דג גזר כובע