אלגוריתם התוכן החדש של גוגל המשך

קידום אתרים אפקטיבי ברמה אחרת...

ניהול מוניטין
בחלק הראשון של המאמר הצגתי סקירה ורקע להישג המרשים של גוגל באלגוריתם התוכן החדש הנוגע למילים נרדפות. כעת נצלול להדגמת ביצועיו החדשים כפי שחושף סטיבן בייקר,מהנדס גוגל.

בחלק הראשון של המאמר הצגתי סקירה ורקע להישג המרשים של גוגל באלגוריתם התוכן החדש הנוגע למילים נרדפות.כעט נצלול להדגמת ביצועיו החדשים כפי שחושף סטיבן בייקר,מהנדס גוגל.

הטכניקות בהן ממצא גוגל את הכרתו עם מילים נרדפות הן רבות וכוללות סריקה כמות אסטרונומית של מסמכים ברשת (petabytes – היקפים של 1024 טרה בייטס של מסמכים) ושל תיעוד היסטוריות חיפוש בעבור כל מילה או צרוף מילים באופן שמספק לגוגל מידע על כל ההטיות והקונטקסטים שבעבורן מילה יכולה להופיע.

  1. ברמה ה”בסיסית” מציג גוגל את יכולתו לזהות מילים נרדפות “פשוטות” .לדוגמא,גוגל מזהה את הקשר בין המילה pictures והמילה photos
  2. ברמה מתקדמת יותר ידע גוגל לזהות סט של מילים ולהבחין האם כתוצאה משילובם ביחד משתנה משמעותם. למשל הצרוף “motion pictures” לא יגרום לגוגל להציג תוצאה כמו- “motion photos”. זוהי דוגמא מצוינת למידת הבנת הקונטקסט שנותן צרוף של מילים ומשנה את משמעותן.
  3. גוגל גוזר מילים בעלי שורש או מוצא דומה. מצד שני מרשימה העובדה שהוא יודע להבדיל בין מילים שלכאורה מציגות אטימולוגיה זהה (מוצא/שורש דומה) אך בעלי משמעות שונה לדוגמא: המילים : animal לעומת animation .מילים אלו לדוגמא לא יוצגו כמילים נרדפות מה שמראה שגוגל הצליח “להבין” מעבר לזיהוי תבנית.
  4. גוגל מקשר בין יחיד לרבים,פעולה שנראית בשפות רבות כפשוטה עקב הוספת תבנית קבועה.לדוגמא באנגלית סיומת S הופכת מילים רבות להטיית “רבים”. גם כאן הצליחה גוגל להוכיח יכולת הבחנה מרשימה כאשר הוספת האות S שינתה לחלוטין את משמעות הביטוי. למשל כאן: arm reduction לעומת – arms reduction (הורדת שומן מהזרוע לעומת… פרוק מהתחמשות נשק)
  5. גם בביטויים עם משמעויות רבות מצליחה גוגל ליצר אבחנה תלוית הקשר ואפילו תלוית מיקום חיפוש (במקרה של חיפוש מסלולר) לראשונה ניתן לראות ביטויים מסוימים שמקבלים ריבוי משמעויות כאשר סט של הצלבות (כמו הקשר החיפוש,הסטוריית חיפוש של הגולש או מיקום ממנו נערך החיפוש יתנו תוצאות שונות בהתאם. לדוגמא לביטוי GM יש תוצאות שונות כשמדובר במכוניות (General Motors),כשמדובר בלימודים או בחיפוש תלוי איזור (George Mason university ) או להבדיל- general manager

איך מילים נרדפות מוצגות

מלבד שכלול משמעותי ביכולת הזיהוי של מילים נרדפות שינתה גוגל גם את אופן הצגתן של תוצאות שנגזרו ממילים נרדפות.

אם בעבר הציגה גוגל בתוצאות החיפוש למילת מפתח מסוימת גם הטיה ,יחיד רבים של אותה מילת מפתח ,היום גם מילים נרדפות מוצגות בהדגשה כך שהגולש יוכל להבין מדוע בחרה גוגל להציג בפניו תוצאת חיפוש מסוימת למילה שלא ביקש.

למשל אם יקיש מילת מפתח כמו “תצלומים” יקבל תוצאות חיפוש שידגישו גם את המילה “תצלום” אך גם “תמונות” גם אם המילה “תמונות” לא הוזכרה בחיפוש אלה מהווה מילה נרדפת שגוגל הבין שיש להציג לביטוי “תצלומים”.

הדגשה זו לא קורית בכל מצב אלה בקונטקסט החיפוש הרלוונטי. כלומר בתלות לקונטקסט הכללי של החיפוש.