כיצד גוגל מחליטה אם האתר שלכם הוא אוטוריטה או לא?

במערכה הרציפה של גוגל נגד תכנים בעייתיים, שוב צפה השאלה: כיצד יודעת גוגל שתוכן מסויים הוא בר סמכא? ובכן, התשובה הפשוטה היא שלגוגל אין מדד אחד שעל פיו נקבעת מידת הסמכותיות (Authority) של תוכן, או במילים אחרות, לא קיים מדד אחד שעל פיו יכולה לקבוע גוגל את מידת האוטוריטה של תוכן מסויים. במקום זאת, בוחנת גוגל סט שלם של מדדים, שאותם היא אינה חושפת לציבור הרחב, ואשר יכולים להשתנות ממקרה למקרה, בהתאם לשאילתת החיפוש.

מדד האוטוריטה המקורי: דירוג הדף (PageRank)

בימיה הראשונים, אכן השתמשה גוגל במדד אוטוריטה אחד. מדד זה נקרא PageRank, ובמהותו נועד למנות את מספר הקישורים אל הדף. גוגל מנתה את מספר הקישורים המפנים אל הדף, ומכך גזרה את ציון ה-PageRank של אותו דף כעדות למידת האוטוריטה שלו. יחד עם זאת, גוגל לא תגמלה אוטומטית את הדפים עם מרב הקישורים הנכנסים, אלא בחנה גם את חשיבותם של אותם קישורים. דף שאליו מפנים מעט קישורים "חשובים" או "נחשבים" אחרים, קיבל ציון גבוה יותר מאשר דף אליו מפנים מספר רב של קישורים, אך חסרי חשיבות יחסית.

גם לדפים שזכו לציון PageRank גבוה, לא הובטחה ההמראה אל המיקומים הראשונים בצורה אוטומטית. ציון זה היה רק פרמטר אחד מתוך שורה של פרמטרים אותם בחנו האלגוריתמים של גוגל בהחלטה לדירוג הדף בתוצאות החיפוש. המילים שהופיעו בעוגן הקישור למשל, שיחקו תפקיד חשוב בשקלול הכולל, וכך גם המילים שהופיעו בתוכן של אותו דף עצמו.

חישוב מידת האוטוריטה של דף – המצב הנוכחי

כיום, קישורים ותוכן עדיין משמשים כמדדים חשובים ומרכזיים בדירוג דפי אינטרנט על ידי גוגל. יחד עם זאת, כיום עומדת לרשות גוגל גם היכולת לבחון את איכות התוכן באמצעות כלי בינה מלאכותית, שהופך למדד יותר ויותר חשוב בדירוג הדפים. מעבר לכך, עושה גוגל שימוש ב-200 מדדים נוספים, המיועדים כולם לאפשר לה לגבש את ציון האוטוריטה של כל דף ודף באינטרנט. אף אחד מן המדדים הללו לא מהווה מדד שיכול בפני עצמו, לדרג את מידת האוטוריטה של הדף, והגישה היא יותר כוללנית ומבוססת על אוסף של פרמטרים, שרק כולם יחד יכולים לספק ציון מהימן ומשקף ביחס למידת האוטוריטה של התוכן בדף.

גוגל כמובן, אינה חושפת את אותה קבוצת מדדים, המשמשים אותה לדירוג התוכן בדפי האינטרנט, אך ידוע כי החברה מעסיקה מדרגי תוכן אנושיים, הפועלים על פי פרוטוקולים מסודרים ומובנים לדירוג תוכן, ואמורים לסייע לחברה להבין נכון וטוב יותר כיצד ניתן לדרג את מידת האוטוריטה של תוכן, וכיצד נתן לתרגם זאת למערכות בינה מלאכותית. מדרגי תוכן אנושיים אלה, אינם משפיעים בפועל על דירוג הדפים, אלא משמשים רק ככלי לימוד ופיתוח עבור גוגל.

מידת האוטוריטה – ציון הניתן לדף הבודד

על אף שלא קיים מדד אחד, שאיתו ניתן לדרג את מידת האוטוריטה של תוכן, סט המדדים המיושם מתפקד בדיוק כאחד כזה. במצב זה, נשאלת השאלה: האם מידת האוטוריטה לתוכן נבחנת עבור כל דף בנפרד, או שציון האוטוריטה ניתן לדומיינים שלמים, ומשם מושלך לדפים השונים בדומיין. במילים אחרות, האם ציון האוטוריטה ניתן עבור התוכן בדף הספציפי, או עבור מידת האוטוריטה של האתר כולו?

על פי גוגל, בחינת האוטוריטה מתבצעת ברמת הדף הבודד, ולמעשה החברה נזהרת מאוד ממתן ציון כולל לאתר בשלמותו, שכן מהלך כזה יכול להוביל להנחות שגויות ביחס לתכנים אחרים ותכנים חדשים המופיעים בחלקים אחרים של האתר, במיוחד במקרים של אתרים מובילים ופופולאריים. כמשל, ניתן לחשוב על ההיגיון בכך שלא קובעים את מידת האוטוריטה של יוטיוב או של פייסבוק בכללותם, אלא של המשתמש הבודד בפלטפורמות אלה. עצם העובדה שתוכן מופיע באתר פופולארי ומוביל, אינה מצביעה על כך שאותו התוכן הוא בעל אוטוריטה, או בעל אותן סגולות ייחודיות שהפכו את האתר המארח לפופולארי.

פרט לגוגל, ישנם גם כלים חיצוניים ואתרי צד שלישי, המנסים להעריך את מידת האוטוריטה של דפי אינטרנט שונים, אך חשוב להבין שכלים אלה אינם קשורים כלל לגוגל, והערכותיהם מבוססות על ניחוש מושכל לגבי האופן בו הייתה גוגל מדרגת את אותם דפים.

מדדים לבחינת האוטוריטה – ברמת האתר/ דומיין

אחרי שאמרנו את זה, על אף שציון מידת האוטוריטה ניתן עבור הדף הבודד, גוגל דווקא כן עושה שימוש במדדים רוחביים לרוחב האתר, שיכולים להשפיע על הציון שיקבל דף בודד באותו אתר. כך למשל, מהירות העלייה של אתר או האם אותו אתר נפגע מתוכנות זדוניות, הם מדדים שבהחלט יכולים להשפיע על הציון שיקבל דף בודד באותו אתר. במילים אחרות, כשכל הנתונים זהים בין שני דפים שונים, מדדים רוחביים ברמת האתר יכולים בהחלט להשפיע על הדירוג של כל אחד מן הדפים.

כך למשל, אם נניח מאמר אחד שמפורסם במקביל, הן באתר חדשות מוביל והן באתר קטן ושולי – הדף בו יפורסם המאמר באתר החדשות המוביל, יקבל ציון גבוה יותר מזה שבו יפורסם המאמר באתר הקטן. הסיבה לכך היא הציון הגבוה יותר שניתן לאתר המארח, ואשר משליך על הדף הבודד. יחד עם זאת, המצב של "כל הנתונים זהים" הוא מצב נדיר.

תכנים המפורסמים באינטרנט צוברים מהר מאוד מאפיינים שונים שהופכים אותם לייחודיים ושונים מכל תוכן אחר באינטרנט (פרסומות בדף, באנרים, שילוב מדיה תמונות ווידאו, תגובות וכן הלאה). בדיוק את המאפיינים האלה מיועד אותו סט של מדדי אוטוריטה לבחון, על מנת לגבש את מידת האוטוריטה של הדף הספציפי בצורה המדויקת והמהימנה ביותר שניתן.

בנוסף לכך, על פי גוגל, האופן בו נבחנת האוטוריטה של התוכן והמדדים בהם נעשה שימוש לבחינתה, יכול להשתנות בהתאם לשאילתת החיפוש של המשתמש.