הדלפת מסמכי גוגל הגדולה: כל מה שצריך לדעת ואיך זה הולך להשפיע על עולם ה-SEO?

Facebook
Twitter
LinkedIn
WhatsApp
Email
תוכן עניינים

באחת ההדלפות הגדולות שידעה גוגל, הופצו מסמכים העוסקים בגורמי דירוג שונים הקשורים למנוע החיפוש. לאחר שנבדקו ואושש מקור המסמכים, הנה כמה תובנות שכדאי לשים אליהן לב (כולל כמה שקרים של גוגל שהופרכו בעקבות ההדלפה).

ראנד פישקין, מנכ"ל Sparktoro (וגם Moz לשעבר), קיבל ב-5 למאי 2024 מייל מגורם אנונימי ששיתף אותו באסופת מסמכים שהודלפו מגוגל: GoogleApi.ContentWarehouse.V1.Model.CompressedQualitySignals (קישור למסמך המלא, שככל הנראה כבר אינו מכיל את מודול החיפוש).

המסמכים עוסקים בנושאי אינדוקס ודירוג במנוע החיפוש של גוגל, והם אומתו כמסמכים אותנטיים על ידי מספר גורמים, שמכירים את פורמט המסמכים הפנימי בחברה.

כאן המקום לציין שגם גוגל התייחסה להדלפה, וביקשה שלא לקפוץ למסקנות מוטעות על בסיס חומר לא מעודכן, חלקי ונטול הקשר. כמו שאומרים אצלנו: "טוב אחי".

מה כוללים מסמכי ה-API שהודלפו?

כבר היו מספר הדלפות מגוגל הקשורות למנוע החיפוש (חלקן קשורות למשפט שמתנהל לאחרונה נגד החברה), אבל מעולם לא בסדר גודל כזה. כמו כן מסמכי הפטנטים של גוגל תמיד היו נגישים לבדיקה, וגם הם שימשו לבדיקת גורמי הדירוג מאז ומעולם.

בהדלפה הנוכחית מדובר ב-2,569 מסמכי Search API, העוסקים ב-14,014 תכונות הקשורות לאינדוקס ודירוג בתוצאות החיפוש. ה"תכונות" במסמכים נקראות בשמות שניתן לזהות ולהבין את משמעותם, כגון siteAuthority, badClicks, goodClicks (אגב שקרים של גוגל) ועוד.

בניתוח שנעשה על המסמך, נמצא כי 8,000 מהתכונות קשורות לחיפוש בגוגל – וכל השאר קשורות לפיצ'רים אחרים כגון העוזר האישי (גוגל אסיסטנט), מפות, אפליקציות, וידאו ועוד. מפאת קוצר היריעה נתייחס כאן למספר אלמנטים עיקריים בלבד. מי שרוצה להעמיק יכול לקרוא פירוט ארוך יותר באתר I Pull Rank.

כרום משמש למדידת ביצועים

כפי שרבים בתעשיית ה-SEO יודעים, כרום הוא לא רק דפדפן תמים למראה. כבר שנים טוענים שהוא לא רק אוסף מידע, אלא שמידע זה משמש את גוגל בסידור תוצאות החיפוש (גוגל טוענת במשך שנים שאנליטיקס לא משמש למטרה זו, ולכן כרום היה אחד המועמדים הבאים בתור).

לפי מסמכי ה-API שדלפו, כרום מסייע למנוע החיפוש לקבוע אילו קישורים הם חשובים, איך לחשב את משקלם של סיגנלים באלגוריתם, האם עמוד מסוים הפך להיות חשוב לאחרונה, מתי להציג תמונות, וידאו ועוד. כל זה חלק ממה שנקרא במסמכים NavBoost – מערכת לקביעת מיקומים מחדש, בהתבסס על קליקים והתנהגות משתמש.

אגב, מערכת קביעת המיקומים בגוגל נקראת Mustang – והיא כוללת בתוכה תת-מערכת שנקראת Ascorer שקובעת את המיקומים הבסיסיים של כל עמוד, טרם כל שינוי שמבוצע לאחר מכן על ידי נאב בוסט. מערכת האינדוקס נקראת Alexandria.

מעקב אחר נתוני קליקים

במשך שנים רבות יש ניחושים האם CTR ונתוני קליקים משפיעים על מיקומים בגוגל. נעשו בנושא הזה אינספור ניסויים ונשפכו מיליוני מילים, והנה מסמכי ההדלפה נוקבים בתכונות כגון goodClicks או badClicks – לעומת longClicks וכן הלאה. זה לא אומר שהנתונים משמשים לקביעת מיקומים, אבל הגיוני לשער שכן.

ארגז החול קיים

פחות או יותר מאז תחילת שנות האלפיים היו אינספור ניחושים האם קיים Sand Box בגוגל: מקום שאליו מושלכים אתרים חדשים כדי למנוע מהם להתקדם, עד שיקבלו את האישור המיוחל מגוגל. כעת מסמכי ההדלפה מאשרים את קיומו של ארגז החול.

סמכות אתר – יש דבר כזה

עוד ויכוח ישן נושן. גוגל טוענת במשך שנים כי אין לה ציון ספציפי שקשור ל- Domain Authority – אבל ההדלפה חשפה את התכונה siteAuthority בצורה שלא משתמעת לשתי פנים. יכול להיות שזה באמת לא אותו הדבר, אבל זה מספיק קרוב.

קישורים חשובים

אומנם גוגל כבר לא מכחישה היום שיש לקישורים חשיבות, אבל זה היה נושא מוכחש במשך שנים. מסמכי ההדלפה מציינים תכונה שנקראת sourceType – שנראה כי היא מקשרת בצורה חלשה בין קישור לעמוד ובין היכן הוא נמצא. ככל שהעמוד "רענן" יותר, כך גדלה חשיבות הקישורים שלו.

כמו כן אם לקישור אין התאמה לאתר שאליו הוא מקשר (Anchor Mismatch), הוא עלול לקבל ציון שלילי (Demotion).

לגודל הפונט יש חשיבות

גוגל עוקבת אחרי גודל הפונטים בדפי האתר (avgTermWeight), כולל טקסט עוגן בקישורים.

לקישורים פנימיים יש חשיבות פחותה

במצבים מסוימים גוגל מתעלם מקישורים פנימיים; זאת לפי התכונה המעורפלת והלא ברורה שנקראת droppedLocalAnchorCount (המילה "לוקאל" משמעה "בתוך אותו אתר").

מדידת קישורי ספאם

גוגל עוקבת אחרי מה שאנחנו קוראים לו Link Spam Velocity באמצעות התכונה הכללית phraseAnchorSpam, שנחלקת לכמה סוגים במסמך.

מעריכי האיכות חשובים יותר ממה שנדמה

מעריכי האיכות (Quality Raters) הם בני אדם שבודקים אתרים ומסייעים לגוגל להבין כיצד לדרג אותם. נושא זה ידוע כבר שנים, אבל לפי מסמכי ההדלפה חשיבותם של המעריכים גדולה יותר. יתכן שמסקנותיהם נלקחות בחשבון בצורה ישירה יותר ממה שנדמה.

לאתרי YMYL יש חשיבות

אמנם כולם מתעסקים לאחרונה עם EEAT (בגוגל קוראים לזה YMYL), אבל מסמכי ההדלפה חושפים שבגוגל יש ציונים ספציפיים בנושא הזה (למשל: ymylNewsScore לאתרי חדשות). בהמשך לנושא הזה, גוגל מזהה את כותבי האתר (author) והאם ישות המופיעה בעמוד היא כותב העמוד (isAuthor).

רשימות לבנות של אתרים

גוגל מחזיקה רשימות ידניות של אתרים "טובים", שעליהם ניתן לסמוך, בתחומים כגון תיירות, קורונה, זיופי בחירות ועוד. בנושאים קריטיים לחיים, כגון קורונה וזיופי בחירות, בהחלט ברור מדוע גוגל תרצה להחזיק רשימות לבנות כאלה, וזאת כדי לסנן אתרים בעייתיים ולמנוע הפצה של פייק ניוז שעלול לסכן חיים או לגרום לבעיות חמורות אחרות.

קישורים רעילים אכן קיימים

גם זה אחד הדיונים הבלתי פוסקים בקהילת ה-SEO, והנה גוגל מספקת לנו תשובה חותכת – יש דבר כזה "קישורים רעילים" (badbacklinksPenalized) והם אכן יכולים לפגוע במיקומים. המסמך אף נוקב בשמו של אלגוריתם פינגווין בהקשר לענישה: penguinPenalty

הגבלת מספר האתרים בנושא מסוים

ייתכן כי גוגל מגבילה את מספר האתרים מאותו סוג המופיעים בכל SERP בתגובה לחיפוש. לדוגמה, אתרים מסחריים מתויגים באמצעות commercialScore, בלוגים מתויגים בצורה אחרת וכן הלאה.

ככל הנראה גוגל מגבילה מראש כמה אתרים מסחריים, אתרי תיירות, בלוגים ואתרים קטנים יוכלו להופיע בתוצאות פר כל שאילתת חיפוש. זה עולה בקנה אחד עם ההצהרה של גוגל אודות גיוון דומיינים בתוצאות.

בהקשר לנושא הזה – גוגל מתייגת אתרים לפי תחומים: אתרי מסחר, אתרי וידאו ואפילו אתרים אישיים קטנים.

מעקב אחרי אזכורים

במסמך הפטנט המקורי של אלגוריתם פנדה, כתוב כי המערכת עוקבת אחרי שמות / אזכורים של ישויות (אנשים, אתרים, מקומות וכו'). לפי המסמך, אזכורים כאלה יכולים לשמש על תקן של קישורים ישירים או עקיפים.

כעת גם ההדלפה הנוכחית מציינת את נושא האזכורים (RepositoryWebrefMention), שיכולים לכלול שמות מותג וכן הלאה.

לטייטלים יש השלכות רוחביות

כותרות עמודים נמדדות לפי שאילתות חיפוש – עד כמה הטייטל תואם לשאילתה. אלמנט הנקרא titlematchScore רומז להשפעה של טייטל בודד על האתר כולו. אם עד היום חשבנו שלכל עמוד יש טייטל משלו וזהו, הרי שכאן נראה שיש לכך השפעה גם על האתר ככלל.

תאריכים הם חשובים

יש חשיבות לעמודים רעננים ולכן גם לתאריכים יש חשיבות – הן כאלה המופיעים בצורה מפורשת (bylineDate) והן כאלה שגוגל מחלץ בדרכים אחרות (syntacticDate, semanticDate).

האם צריך לשנות משהו באופן שבו עושים קידום אורגני?

אם אתם עושים קידום אתרים אורגני בגוגל או משלמים לחברה/מקדם אתרים על השירות – שווה לבדוק שהם מעודכנים ועושים את עבודת ה-SEO על הצד הטוב ביותר, מבלי להזניח אף פן שיכול לעזור לאתר למקסם את הפוטנציאל שלו.

כמובן שמה שהזכרנו בפוסט הזה הם רק עיקרי הדברים ולא הרשימה המלאה לפיה אלגוריתם החיפוש עובד (העניין הזה עדיין נשמר בסוד). יחד עם זאת, כחלק מהעבודת הקידום האורגני בחברה שלנו, תמיד הקפדנו לתת דגש על הפרמטרים שהוזכרו במסמך שדלף ואף הרבה מעבר. מבחינתנו, שום דבר לא השתנה, פרט לכך שקיבלנו חיזוק לדברים רבים שידענו שהם נכונים מבלי שהיה להם אימות רשמי מגוגל.

אנו מעריכים שתחום הקידום האורגני בגוגל כנראה לא ישתנה או יעבור טלטלה בגלל הדלפת המסמכים הללו. מי שידע מהן הפעולות שיש לעשות כדי למקסם את אהבת האלגוריתם לאתרים שאנו חפצים ביקרם, קיבל חיזוק לכך. מי שניסה להתעלם מחלקים מסוימים של עבודת הקידום האורגני, כמו למשל הניסיון לטעון שאפשר לקדם אתר בלי קישורים, יצטרך להתיישר ולעשות התאמות בשיטת העבודה שלו.

עד כמה הפוסט הזה עזר לכם?

דירוג ממוצע 5 / 5. כמות דירוגים: 4

אף אחד עדיין לא דירג את הפוסט, אתם יכולים להיות הראשונים 🙂

אנחנו מצטערים לשמוע שהפוסט לא עזר לכם

נשמח לשפר את הפוסט

ספרו לנו איך נוכל לשפר אותו

Facebook
Twitter
LinkedIn
WhatsApp
Email
על הכותב

מוכנים להתקדם?

צרו איתנו קשר עוד היום ונשמח לעזור