על גוגלך תלך וקבצי פלאש תאכל

מחלקת הזוחלים של Google החליטו לשתף פעולה עם Adobe וסוף סוף לשפר את רובוט הסריקה שלהם על פי קול ההמון: "על גוגלך תלך וקבצי פלאש תאכל!"

עכביש ברשת

אם המשפט הקצר הקודם לא ברור, להלן ההסבר:
מנועי החיפוש סוקרים את הרשת בעזרת תוכנות המכונות "זחלנים" או "Spiders". התוכנות האלה עוברות על דפי האינטרנט ומדווחות בחזרה למנוע החיפוש מה יש בדפים. מנועי החיפוש שומרים את הכל בצורה מתוחכמת של אינדקסים בהם לכל תוצאה יש ציון על פי מילות החיפוש. כשאנחנו נכנסים לגוגל ומקלידים מילה, התוצאות נשלפות ממאגר של תוצאות שכבר מוכן.


אז איפה הבעיה?
הבעיה היא שהזחלנים מסוגלים לקרוא טקסט, רק טקסט. באתרי האינטרנט אנחנו משתמשים בתמונות, בתפריטי Java ובקבצי Adobe Flash. את כל אלה הרובוטים לא מבינים.

לגבי תמונות, יש למתכנתים דרך להסביר לגוגל מה יש בתמונה, תאור קצר.
לגבי קבצי Java הדבר תלוי מאד במתכנתים ובדרך שהם כותבים.
ולגבי קבצי Flash - סוף סוף Google מתמודדים איתם.


מה הזחלן של גוגל מבין בקבצי פלאש?
הזחלן מבין תוכן טקסטואלי מכל הסוגים, הזחלן מבין גדג'טים, כפתורים, תפריטים. הזחלן מבין קישורי URL אליהם מפנה הפלאש.

מה הזחלן לא מבין?
תמונות בקבצי פלאש, תפריטים שבנויים מתמונות, קטעי וידאו...
וגם (שימו לב!!!)
גוגל לא מבצע פקודות Java המוטמעות בקבצי ה Flash.
גוגל לא מאנדקס תוכן שנטען על ידי הפלאש כחלק מהדף (למשל קבצי XML).
והכי גרוע - גוגל לא מאנדקס עברית מקבצי פלאש וגם לא ערבית.

רוצים עוד מידע? קראו את המאמר הרשמי של גוגל על סריקת תכני פלאש