גוגל - אנדקס אותי מהר!

לפעמים אנחנו רוצים שגוגל יאנדקס תוכן מסויים מהר, למשל כשאנחנו מפרסמים ארוע. התאריך סוף סוף נסגר ונקבע לעוד חודש, הוספנו דף מיוחד באתר שלנו שמודיע על הארוע וגוגל... הוא לוקח את הזמן שלו ולא מוסיף את הדף החדש.

למה זה חשוב לנו?
אנחנו הולכים לפרסם את האירוע בעוד מקומות ורוצים שגוגל יקלוט מהר מי המקור ויפנה אליו ראשון.

למה זה קשה לנו?
כי הדף שהוספנו אינו הדף הראשי באתר, והרובוט של גוגל סורק את עומק האתר שלנו רק פעם בכמה ימים.

איך אנחנו יודעים שהדף נרשם בגוגל?
פשוט מאד, אנחנו מחפשים את הכתובת שלו בגוגל עם המילה cache ונקודותיים, כך : cache:exampleURL.co.il . אם הדף נקלט, נוכל לראות מה גוגל שומר אצלו.

ואם לא נקלט? איך דוחפים בכח?
או, זאת השאלה. ישנן מספר טכניקות:
  1. להציג בדף הבית קישור לדף הפנימי. מאחר ודף הבית נסרק בתדירות גבוהה יחסית, הקישור לדף הפנימי יגרום לרישומו.
  2. לפרסם את הקישור לדף ב RSS של האתר. שוב, בהנחה שה RSS מתעדכן מהר ונסרק מהר, הדבר יגרור רישום.
  3. לפרסם את הדף בבלוג, למשל בבלוג כמו זה. מאחר וגוגל מחובר למערכות הבלוגים בצורה הדוקה, ומאחר וידוע שכל בלוג חייב להתפרסם מיידית כי זו מהותו, פרסומי בלוגים נקלטים על ידי גוגל במהירות. אם הפרסום מכיל גם קישור לדף לא מוכר - גם הדף הזה יסרק.
למעשה הפרסום בבלוגים הוא הדרך הכי מהירה שיש. גוגל חולה על זה.

והחיסרון?
גוגל מניח שפוסט חדש בבלוג הוא משהו שחייבים לקלוט. לעומת זאת, אחת שפרסמתם פוסט, כנראה שהוא כבר ישאר אותו דבר. במילים אחרות - גוגל יאנדקס מהר מאד פוסט חדש אבל לא יסרוק אותו שוב ולא יבדוק שינויים לאחר מכן אלא במרווחים מאד גדולים.

אזהרה- אם טעינו בפוסט, הטעות תישמר לפחות חודשיים. אם פרסמנו טיוטה - הטיוטא תישמר בזיכרון של גוגל והוא יציג את הפוסט המלא שיצא חמש דקות מאוחר יותר שוב בעיכוב של חודשיים.

מסקנה - לא מפרסמים שום טיוטה אף פעם. מפרסמים את הפוסט רק כשהוא ערוך ומוכן ומכיל את כל המידע והתמונות.

פרדריק שופן

פרדריק שופן או בשמו המלא פרדריק פרנסואה שופן הוא דוגמה לדף סתמי שמטרתו לנסות לתפוס יום חג גוגלי עולמי.

בניגוד לסברה הרווחת ברדיו פרדריק שופן לא הלחין אף שיר של מושיק עפיה. אחת לזמן כלשהו גוגל מחליטים לחנך אותנו ומחליפים את הלוגו שלהם בנושא כלשהו. אני בטוח שיום אחד הם יזכירו גם את פרדריק שופן. זה פשוט לא הגיוני שלא... במיוחד שעוד מעט יום הולדתו המאתיים והם אוהבים את זה.

בכל אופן, ברור שהדף הזה שאתם קוראים עכשיו אין לו שום קשר עם שופן וזה בדיוק העניין.

הדף הזה יכול להראות איך עובד המנוע של גוגל ואיפה נקודת התורפה שלו. גוגל מנתח את המידע בצורה סמנטית, כלומר מחפש את הביטוי העיקרי, במקרה שלנו פרדריק שופן, בתוך הטקסט. אבל גוגל לא מבין את המידע. השאיפה האולטימטיבית היא שגוגל יבין את הדפים כמו בן אדם, אבל אם הגעתם לדף הזה בחיפוש אחרי הערך פרדריק שופן, אתם יודעים שזה לא המקרה. הדף הזה לא מדבר בכלל על פרדריק, למעשה לא למדתם ממנו שום דבר חדש על שופן.

כלומר, אם הגעתם מגוגל, זו הוכחה שהאלגוריתם של גוגל אינו טוב מספיק.

אבל אנחנו נוותר להם הפעם. הם באמת משתדלים. פשוט, המשימה של "להבין טקסט כמו שבן אדם היה מבין אותו" זו בעיה קשה מאד שבכלל לא בטוח שמישהו יכול לפתור.

בסופו של דבר גוגל יעברו כנראה לשיטה סטטיסטית: אם מספיק אנשים נשארים מספיק זמן בדף הזה, כנראה הוא מעניין, כנראה שהוא באמת מדבר על פרדריק שופן.
אז תשארו קצת, שוטטו בסביבה ואל תשכחו מדי פעם גם לחפש את יותר מזל משכל בגוגל.

רק ליתר ביטחון, הנה דף אח שמדבר על ניקולאי גוגול. או ליתר דיוק לא מדבר עליו בכלל. שימו לב שהכיתוב בשני הדפים דומה מאד.

עד כאן הדף שלא מדבר בכלל על פרדריק פרנסואה שופן, מה אכפת לכם ממנו בכלל. פרדריק שופן מת כבר מזמן וכמו שכבר נכתב, לא הלחין אף שיר של מושיק עפיה.