טקסונומיה קוגניטיבית, אינטרנט וחתולים

טקסונומיה (מיוונית – taxis: סידור; nomie: שיטה, חוק) היא סיווג שיטתי של עצמים מאותו תחום.
מתוך ויקיפדיה.

בפוסט הזה אני רוצה לדבר על טקסונומיה - סיווג ומיון דפים באתר אינטרנט. מיון היררכי, מיון תגיות ומיון קוגניטיבי. אתיחס לנושא מההבט של חווית המשתמש וקידום אתרים בעברית.

... בררר מישהו בכלל מסוגל לעקוב אחרי זה? טוב, מההתחלה...

הסיווג הנפוץ ביותר לדפים ברשת הוא מדרגי (הירארכי), לדוגמה:
דף הבית > המוצרים שלנו> ידיות > ידיות שקועות
זה מדרג שמחקה את מבנה התיקיות שיש לנו במחשב. זו שיטה נוחה לתיוק והיא מזכירה לנו את העולם האמיתי - איפה שמתי את הדג? אה, כן - בצינצנת עגולה שעל המגרפה שביד הימנית של החתול!


הדג לא יכול להיות בשני מקומות בעת ובעונה אחת. או שהוא על המגרפה או שהוא על השולחן.
החיסרון של מיון כזה ברור, אם אנחנו לא יודעים איפה הדג, לא נמצא אותו.

המיון השני הנפוץ הוא מיון תגיות. לדוגמה, בבלוג כאן. מיון תגיות יגדיר קבוצות אליהן שייך המידע. למשל המידע "חתול" יהיה מסומן גם בתגית "חיות בית" וגם "בעלי פרווה", "הולכי על ארבע" וכדומה. דרופל ומערכות ניהול תוכן אחרות אוהבות לעבוד כך. יתרון השיטה הזו ברור, קל לקבל קבוצות של פריטים על פי שייכותם.
אבל גם לשיטה זו יש חיסרון בולט, אם לא חשבנו על הקבוצה הזו מראש, לא נדע לשייך את המידע.


המיון האחרון הוא מיון קוגניטיבי. במיון הזה אנחנו מחקים את ההתנהגות של המוח האנושי. למשל - אלה המילים בהן אנחנו יכולים להזכר בהן כשנחשוב על "חתול" -
חתולים, חתולה, חתלתול, חיות בית, חתול צעצוע, סיאמי, וטרינר, כלב, עכבר, מזון חתולים...

"אחלה" אתם אומרים "אבל מה זה עוזר לי בכלל? איך אני בונה משהו כזה? איך אני מחקה במחשב את ההתנהגות הזו? מאיפה אתה רוצה שהמחשב ידע להציע למשתמש שחיפש 'חתול' גם דפים שבהם מופיעה המילה 'חתלתול'? זה בכלל אפשרי? הרי השאילתה ב SQL לא לוקחת את הסיבוב ככה."

אמממ...כן. זה אפשרי ולמעשה קל (כלומר קל לנו לקבל את הפיתרון חינם).
קודם כל נראה שזה אפשרי - הנה, תסתכלו כאן - זה מנוע חיפוש לקישורי מילים.
והוא מצביע על המילה "חתול" וכל ההקשרים שלה.

גם גוגל כמובן משתמש בזיהוי כזה. איך חשבתם שהוא מחזיר לכם מילים נרדפות? למה חיפשנו "קבצים" וקיבלנו תוצאות עם המילה "קובץ"? למה חיפוש על המילה "חתולים" החזיר את הרשימה שבראשה המינוח "חתול" מויקיפדיה? איך הם עושים את זה?

אז ככה - הם הרי סורקים את הטקסטים מכל העולם ואחותו. ועלה על דעתם שהרבה מאד פעמים הם ראו את המילה "וטרינר" או את המילה "סיאמי" ליד המילה "חתול".
"הי!", אומר לעצמו גוגל, "אולי יש קשר בין המילים האלה? אני אשמור לי את זה."

אפשר לשמוע אתכם עד כאן - "טוב, גוגל יכול להרשות לעצמו מיון קוגניטיבי אבל אני צריך את היכולת הזו בתוך האתר שלי. מה אתה מציע? שאני אבנה מנגנון גוגל שלם לתוך האתר שלי? נראה לך?"

אמממ. כן, למעשה נראה לי מאד. למעשה כל כך נראה לי שזה אפילו בא בחינם. גוגל מחלקים את זה בלי כסף.

עד כאן על סוגי מיונים. על איך לעשות את זה בקלות ועל איך לקדם אתרים במיון תגיות רישתי בעברית - על זה בפעם אחרת.