ראנק בריין (RankBrain): המוח מאחורי המיקומים בגוגל
איך מכונה מבינה שפה ומסיקה מסקנות? תשאלו את גוגל, שב-2015 הביאה לעולם את RankBrain – בינה מלאכותית מתקדמת שאמורה לחשוב וללמוד בכוחות עצמה.
מאת: עמית אדלר
אם נחשוב על זה לעומק כמה רגעים, נבין שגוגל הוא בעצם אחד ממאגרי הידע הגדולים ביותר בעולם. למרות שגוגל בעצם רואה רק את מה שנגיש לו (רוב המידע הדיגיטלי סגור למנועי חיפוש, וידוע בשם "הרשת העמוקה" – Deep Web), זה עדיין מהווה כמות עצומה של נתונים – ומישהו או משהו אמור לעשות סדר בנתונים האלה.
המשהו הזה הוא מנוע חיפוש, שככל שיכולותיו מתקדמות יותר – כך גם איכות התוצאות שהוא מציג או מייצר.
הבינה המלאכותית של גוגל היא לא היחידה שעושה את זה. ב-1996 המחשב "כחול עמוק" של IBM ניצח את אלוף העולם בשחמט דאז, גארי קספרוב. ככל הנראה זו הייתה אחת הפעמים הראשונות בהן בינה מלאכותית הצליחה לגבור על בינתו של אדם (אם כי קספרוב טען בזמנו שבוצעה שם רמאות).
נשמע קצת כמו מבחן טיורינג – אם לא נצליח לזהות שבן שיחנו הוא מחשב, הרי שהוא עבר את המבחן. במקרה הזה מדובר בשותפנו למשחק, אבל ההקבלה מספיק קרובה.
ב-2011 שוב עשתה זאת IBM, והפעם עם המחשב "ווטסון" שניצח שני מתחרים בשעשועון הטריוויה Jeopardy. כשיש לך גישה ליותר מ-200 מיליון דפי מידע בנפח 4 טרהבייט, כולל כל התוכן בוויקיפדיה, כנראה שתצליח לנצח כמה בני תמותה נחותים ממך.
אבל ווטסון לא נעצר בשעשועונים, למרבה הפלא, וכיום משתמשים בבינתו המלאכותית גם בתחום הרפואה. ווטסון סורק מאות ואלפי הדמיות ומבצע אבחונים של מחלות במהירות גבוהה מכל בן אנוש. כמו כן פרויקט ווטסון משמש בעוד כמה תחומים במקביל, כגון תחזית מזג אוויר, אופנה ועוד.
פיתוח מתקדם נוסף בתחום ה-AI שמור לקירה רדינסקי הישראלית, בעלת דוקטורט במדעי המחשב והמדענית הראשית של איביי. דר' רדיסנקי המציאה אלגוריתם מתקדם שמסוגל לחזות את העתיד, באמצעות איסוף מידע מכל רחבי הרשת. בדומה לווטסון של IBM, גם לאלגוריתם של רדינסקי יש גישה לכלל מקורות המידע ברחבי האינטרנט, והוא כבר הצליח להפיק תחזיות לעתיד שאכן התאמתו. זו הסיבה שאיביי מיהרה להכניס את רדינסקי לשורותיה.
אז איך עובד Rank Brain של גוגל?
אם עד לאחרונה המיקוד של גוגל היה Mobile First, הרי שמרגע שראנק בריין נכנס לתמונה – מהות החברה והמיקוד שלה הפכו להיות AI First (הצהרתו הרשמית של מנכ"ל גוגל, סונדאר פיצ'אי). כל זה עוד טרם סיומו של מהלך המובייל פירסט, שהחל לפעול בסוף אוקטובר 2017 וממשיך להוסיף לתוכו אתרים ולבחון את תגובתם.
בתחילת 2014 גוגל הכריזה שרכשה חברה בשם Deep Mind, שפיתחה טכנולוגיית בינה מלאכותית מאוד ספציפית (Deep Learning). כמעט שנתיים לאחר מכן הכריזה גוגל על קיומו של ראנק בריין, שכנראה מבוסס על הטכנולוגיה הצרה הזו – מסוג Narrow Artificial Intelligence. הטכנולוגיה הזו מיועדת לבצע עבודה מסוג מאוד מסוים.
למרות שאין אחד שבאמת יודע את כל הסודות, אפשר להסיק שהמוח של גוגל עובד בכמה רמות במקביל:
1. מייתר את הצורך בשינויי אלגוריתם ידניים.
2. מבין את כוונת המשתמש גם בחיפוש מעורפל ולא ממוקד.
3. בודק בזמן אמת כיצד מגיבים המשתמשים לתוצאה מסוימת עבור חיפוש מסוים, ומשנה את האלגוריתם/ים בהתאם לממצאים.
מה זה אומר, בעצם?
1. מייתר את הצורך בשינויי אלגוריתם ידניים
על מנת לשפר את יכולות האלגוריתמים, אנשי גוגל מבצעים בהם בין 500 ל-600 שינויים שוטפים בשנה (בערך פעמיים ביום בממוצע).
אם עד 2015 מנוע החיפוש של גוגל נסמך על אלגוריתמים סטטיים, שנכתבו על ידי בני אדם, פעלו לפי סדר פעולות מוגדר מראש ועברו שינויים ידניים – הרי שראנק בריין כנראה הופך את הקערה על פיה.
מרגע שראנק בריין נכנס לתמונה, הצורך בביצוע שינויים ידניים (Push) פוחת והולך. הבינה המלאכותית לומדת בכוחות עצמה את מה שהיא צריכה, ומחליטה כיצד להגיב ומה לשנות. זה לא אומר שהשינויים הידניים פסקו, מכיוון שאי אפשר לצפות שהבינה המלאכותית של ימינו תפעיל את אותו שיקול דעת כמו בן אדם. הטכנולוגיה הנוכחית עדיין רחוקה מכך.
2. מבין את הכוונה גם בחיפושים מעורפלים
הבינה המלאכותית של ראנק בריין מבינה הקשרים סמנטיים רחבים יותר מכל אלגוריתם פשוט, ומסוגלת ללמוד בעצמה מה כתוב שם – גם אם זה כתוב ללא המילים המפורשות שהיינו מצפים למצוא. הניסיון הזה לא חדש – עדכון יונק הדבש ששולב בגוגל בקיץ 2013 היה העדכון הגדול ביותר דאז. המטרה הייתה, בין היתר, לתת לגוגל כישורי שפה משודרגים להבנה של "חיפושים בשפה טבעית" (Conversational Search).
בתחילת דרכו של תחום ה-SEO, הודגש ביתר-שאת הצורך להציב מילות מפתח בנקודות אסטרטגיות בעמוד האינטרנט כדי שגוגל יבין במה מדובר. למעשה היו דוחפים את אותה מילת מפתח שוב ושוב, כדי ש"המכונה" תבין שאנחנו מדברים על "שיווק דיגיטלי".
היום זה כבר פחות כך, לפחות בכל מה שנוגע לשפה האנגלית (בעברית גוגל עדיין נמצא שנות אור מאחור). כיום ניתן לשאול את גוגל.קום מה שם אישתו של נשיא ארצות הברית, ולקבל תשובה גם בלי להזכיר את שמו המפורש של הנשיא.
אחת הסיבות לעלייתו של ראנק בריין היא המעבר לחיפושים בנייד וכן חיפושים קוליים, שהפורמט שלהם שונה מעט מחיפושים בדסקטופ. למשל, אם נחפש את השאילתה "המשרד" – מה גוגל צריך לספק לנו? האם החיפוש מיועד למצוא את כתובת מקום העבודה שלנו? האם התכוונו לסדרה הקומית באותו שם?
ראנק בריין אמור לדעת שמדובר כאן בחיפוש מעורפל, והוא יציע את האפשרויות הטובות ביותר בהתאם לממצאים. למשל, אם החיפוש מבוצע ממכשיר נייד – ייתכן שאנחנו רוצים להגיע למשרד ברגע זה ממש. גוגל יציע לנו להקליד את הכתובת ואז ייתן לנו מפה של הדרך.
המערכת מאתרת תבניות בתוך כל חיפוש, באמצעות השוואה לחיפושים אחרים. משמע שגוגל יכול כיום להבין שאילתות חיפוש חדשות לגמרי שמעולם לא הוקלדו בו. בבדיקות שנעשו בגוגל, הסתבר שהמערכת מנצחת את מומחי גוגל בכל הנוגע לבחירת דפים.
אם בתחילת דרכו ב-2015 ראנק בריין פעל רק על 15% מהחיפושים – בעיקר החיפושים החדשים והבלתי מוכרים שמתבצעים מדי יום – הרי שכיום גוגל כבר עברה לשימוש כמעט מלא במערכת. כמו כן ב-2016 שני אנליסטים של גוגל הצהירו בנפרד שראנק בריין הפך לגורם הדירוג השלישי בחשיבותו, אחרי תוכן וקישורים.
3. בדיקת התנהגות ותגובה בזמן אמת
לגוגל יש כמה אלגוריתמים שונים, שכל אחד מהם מופקד על תחומים מסוימים (תוכן, קישורים וכן הלאה). בעוד שכל אלגוריתם כזה כנראה פועל לבד, ראנק בריין בוחן את התנהגות המשתמשים בזמן אמת ומחליט אילו אלגוריתמים להפעיל בהתאם לסיטואציה.
ייתכן שראנק בריין יגלה שעבור שאילתות מסוג מסוים, הפקטור החשוב ביותר הוא דווקא המטא תיאור של העמוד – ולכן חשיבותו של הפקטור הזה תעלה אך ורק לגבי השאילתות הללו. כל זה פועל במשולב עם פקטורים נוספים, כגון חזרה אחורה לתוצאות גוגל, היסטוריית החיפושים של המשתמש, מיקום המשתמש, האם התוצאה מגיעה ממקור אמין או מותג מוכר ועוד.
איך משתמשים בראנק בריין לטובת האתר
גוגל לימדה את ראנק בריין איך נראים אתרים איכותיים, והמידע הזה משמש אותו לביצוע הבחנות בהתאם לסוג החיפוש הנדון ושאר פרמטרים שהוזכרו קודם לכן. למשל, אתרים בתחום הבריאות ייראו אמינים אם יהיו בהם סיגנלים קרובים ככל הניתן לאתרים כגון אתרי ממשלה, אתרי קופות חולים ובתי חולים, מאגרי מידע רפואיים וכן הלאה.
מכאן נובעת החשיבות למיקוד נישתי. ראשית כדאי לבדוק את הכוונה המתחבאת מאחורי כל שאילתת חיפוש. אם מישהו מחפש "הסמארטפון הכי טוב", למה הוא מתכוון? ככל הנראה לא לסמארטפון ספציפי, כי הוא עדיין נמצא בשלב המחקר הראשוני שלו. אז איזו תוצאה תהיה הכי רלוונטית לחיפוש שכזה?
במקרה זה – אם נספק רשימה השוואתית של כמה סמארטפונים, נוכל להתברג גבוה יותר בתגובה לחיפוש הזה. זאת מכיוון שחיפוש כה רחב מבקש בעצם מידע רחב היקף, השוואתי בדרך כלל, שיעזור לגבש את ההחלטה הבאה – איזה דגם מדויק המשתמש ירצה לרכוש.
בדרך אל המיקומים הנכספים, אסור לנו לאבד את מסע הלקוח אל התועלת אותה הוא מחפש. לכן ככל שהאתר שלכם ממוקד טוב יותר בתחום מסוים, כך גדלים סיכוייו להתברג מעלה. לחפש את הביטויים הכי גדולים ולנסות להתברג עליהם, בלי באמת להבין את הכוונה מאחוריהם, כנראה לא יהיה יעיל וגם לא מוצלח.
כמובן שיש גם אתרים שלא פועלים בהתאם למתכונת הזו, כגון אתרי אינדקס, השוואת מחירים ועוד. אתרים אלו מתפרשים על פני קשת רחבה של נושאים, ואינם ממוקדים בנושא מסוים. מה עושה ראנק בריין במצב הזה?
הוא עשוי להשוות אתר מרובה-נושאים לכמה אתרים, או שהוא עשוי לבחור כמה נושאים נקודתיים ולייחס להם את המשמעות הגדולה ביותר (מחשבים וסמארטפונים באתר זאפ) – בעוד שהוא מתעלם או נותן דירוג נמוך יותר לנושאים אחרים באותו אתר (תכשיטים באתר זאפ).
אותו דבר מומלץ לביצוע גם בנושא השגת קישורים חיצוניים. ככל שנשארים קרוב יותר לנישה הרלוונטית גם בקישורים הנכנסים, כך תגדל התועלת. כמובן שיש מקרים יוצאים מן הכלל, ובייחוד כאשר מדובר בגוגל ישראל.
לפעמים גם קישורים מאתרים לא רלוונטיים הם בעלי השפעה חיובית, כל עוד האתרים הלא רלוונטיים הם בעלי ותק וסמכות. לדוגמה, אם קיבלנו קישור מדה-מרקר עבור אתר שעוסק בעוגיות – אני מניח שאף אחד (כולל גוגל) לא יזעק חמס בגלל "חוסר רלוונטיות".
רגע לפני סיום
מבחינת היישום בפועל, כנראה ששום דבר מהותי לא השתנה גם בעידן ראנק בריין. תוכן איכותי וקישורים איכותיים היו ונשארו הגורמים העיקריים לקידום אורגני מוצלח, לצד פרמטרים נוספים כגון התנהגות משתמש, מהירות טעינה, התאמה לניידים ועוד.
מכיוון שההתפתחויות בתחום ה-AI גדלות בקצב מואץ, אפשר לצפות ליום שבו המכונה כן תגבר על האדם. אבל בינתיים פשוט השקיעו באתר ובקהל היעד שלכם, וקטפו את פירות המאמץ.
מקורות נוספים: