חיפוש

מילות מפתח LSI: מהן וכיצד הן עוזרות בקידום האורגני?

Facebook
Twitter
LinkedIn
WhatsApp
Email
תוכן עניינים

מהן מילות מפתח LSI?

מילות מפתח LSI הן מילים וביטויים שקשורים לנושא מסוים מבחינה סמנטית. לדוגמה, ביטויי LSI בתחום המכוניות עשויים להיות רכב, מנוע, כביש, צמיגים, רכב ותיבת הילוכים.

אינדקס סמנטי סמוי (LSI – Latent Semantic Indexing), או גם ניתוח סמנטי סמוי (LSA), הוא שיטה של עיבוד שפה טבעית שפותחה בשנות ה-80. הטכנולוגיה עצמה לא כל כך קלה להבנה, ודורשת ידע בנושאים מתמטיים כגון ערכים עצמיים, וקטורים ועוד.

מכיוון שכך, לא נעסוק באופן שבו פועל LSI – ונתמקד בבעיה שעבורה הוא נוצר: המילים בהן משתמש המחפש, לא תמיד נכללות בתוכן המאונדקס. לעיתים אפשר לדבר על נושא מסוים באמצעות מספר מילים או ביטויים נרדפים שונים.

מדוע מילים נרדפות יוצרות בעיה?

לפי פטנט ה-LSI, אפשר לתאר את אותו מושג או אובייקט במגוון רחב של מילים. אנשים עם ידע שונה, צרכים שונים או הקשרים שונים יתארו את אותו מידע באמצעות מונחים שונים. רק בפחות מ-20% מהמקרים בממוצע, שני אנשים שונים יבחרו את אותו ביטוי עיקרי לתיאור של אובייקט יחיד ומוכר.

איך זה קשור למנועי חיפוש? דמיינו שני דפי אינטרנט שונים בנושא מכוניות. שניהם זהים, אבל באחד משתמשים במילה רכב ובשני משתמשים במילה מכונית.

אם היינו משתמשים במנוע חיפוש פרימיטיבי, שמאנדקס רק את המילים והביטויים בדף, הוא היה מציג בתוצאות רק אחד מהדפים הללו עבור החיפוש "מכונית" – למרות ששני הדפים רלוונטיים. ייתכן אפילו שאחד מהם איכותי יותר מהשני.

זו הסיבה שמנועי חיפוש צריכים להבין מילים נרדפות כדי לספק את התוצאות הטובות ביותר.

מהן מילים פוליסמיות?

מילים וביטויים פוליסמיים הם בעלי משמעויות מרובות ושונות. כאשר מדובר במנועי חיפוש, אותה מילה מקבלת משמעות משתנה (לדוגמה: עכבר במובן של בעל חיים ועכבר בתחום המחשבים).

גם מילים אלו מייצרות בעיה דומה למילים נרדפות. מנועי חיפוש שלא מבינים את המשמעויות השונות של מילים פוליסמיות, נוטים לספק תוצאות לא רלוונטיות.

איך פועל LSI?

מחשבים הם טיפשים ואין להם הבנה של יחסים בין מילים כפי שיש לבני אדם. לדוגמה, כולם יודעים שג'ון לנון היה בלהקת החיפושיות (ביטלס), אבל מחשב לא יודע זאת בלי שיגידו לו.

מכיוון שאין דרך קצרה ופשוטה להסביר זאת למחשב, LSI פותר את הבעיה הזו באמצעות נוסחאות מתמטיות מורכבות. הנוסחאות מסייעות למחשב להבין קשרים בין מילים וביטויים הקיימים בקבוצת מסמכים.

מנועי חיפוש יכולים להשתמש במידע הזה כדי להתקדם מעבר להתאמה מדויקת של שאילתות, ולספק תוצאות חיפוש רלוונטיות יותר.

האם גוגל משתמש ב-LSI?

מכיוון ש-LSI פותר מגוון בעיות בתחום זה, רבים מניחים שגם גוגל משתמש בטכנולוגיה זו. מעבר לכך, ניתן לראות שההבנה של גוגל משתפרת בכל הנוגע למילים נרדפות ופוליסמיות.

אך למרות זאת, רוב הסיכויים שגוגל לא משתמש בטכנולוגיית LSI. איך אנחנו יודעים? נציגי גוגל אומרים זאת במפורש. בנוסף, הנה 3 ראיות המגבות זאת:

טכנולוגיה ישנה

LSI הומצא בשנות ה-80, לפני הקמת רשת האינטרנט העולמית. לפיכך הוא מעולם לא נועד להיות מיושם על קבוצה כה גדולה של מסמכים. גוגל פיתחה טכנולוגיה טובה יותר (וקטור מילים בשם Word2Vec) כדי לפתור את אותן בעיות.

כוח מחשוב

רשת האינטרנט היא לא רק גדולה אלא גם דינמית. משמעות הדבר שמיליארדי העמודים באינדקס של גוגל משתנים באופן קבוע.

זו בעיה מכיוון שפטנט LSI אומר לנו שהניתוח צריך לרוץ "בכל פעם שיש עדכון משמעותי בקובצי האחסון". דבר זה ידרוש הרבה כוח עיבוד.

טכנולוגיה מוגנת בפטנט

הפטנט על LSI ניתן לחברת Bell Communications Research ב-1989. פטנטים אמריקאיים פגים לאחר 20 שנה, מה שאומר שפטנט ה-LSI פג בשנת 2008.

בהתחשב בכך שגוגל היה די טוב בהבנת שפה והצגת תוצאות רלוונטיות הרבה לפני 2008, זוהי עוד ראיה לכך שגוגל לא משתמש ב-LSI.

האם מילים נרדפות משפרות מיקומים בגוגל?

למרות ש-LSI אינו רק מילים נרדפות – שימוש במילים וביטויים קשורים בתוכן, יכול כמעט בוודאות לשפר את ה-SEO.

גם בגוגל אומרים זאת בעקיפין. ביטויים אלו עוזרים לגוגל להבין את הנושא הכללי של הדף, והוא משתמש במידע זה כדי לדרג דפים רלוונטיים עבור שאילתות רלוונטיות.

איך למצוא מילים וביטויים קשורים?

ככל שאנו בקיאים בנושא הנדון, מילים וביטויים קשורים יופיעו באופן טבעי בתוכן שאנו יוצרים. ביטויים מסוימים יופיעו בקלות, בעוד שביטויים חשובים אחרים, בנושאים מורכבים יותר, עלולים להתפספס.

הנה תשע דרכים למצוא מילים, ביטויים וישויות פוטנציאליות קשורות.

השתמשו בהגיון

בדקו את דפי האתר כדי לראות אם פספסתם נקודות ברורות. לדוגמה, אם הדף הוא מאמר ביוגרפי על דונלד טראמפ ואינו מזכיר את ההדחה שלו, כנראה שכדאי להוסיף סעיף בנושא.

זכרו שאין דרך לדעת בוודאות אם גוגל מחשיב את הביטויים הללו כקשורים מבחינה סמנטית. עם זאת, מכיוון שגוגל שואף להבין את הקשרים בין מילים וישויות שאנו מבינים באופן טבעי, יש חשיבות לשימוש בשכל הישר.

השלמות אוטומטיות

השלמות אוטומטיות לא תמיד מציגות מילות מפתח חשובות, אך הן יכולות לספק רמזים לגבי מילות מפתח שעשויות להיות שוות אזכור, כאלה שלא חשבנו עליהן.

אלו לא בהכרח ביטויים קשורים בפני עצמם, אך האנשים והדברים אליהם הם מתייחסים עשויים להיות קשורים.

חיפושים קשורים

"חיפושים קשורים" מופיעים בתחתית תוצאות החיפוש. הם יכולים לספק רעיונות לגבי מילים, ביטויים וישויות קשורים שראוי להזכיר.

שימוש בכלי למילות מפתח LSI

אומנם למחוללי LSI פופולריים אין שום קשר ל-LSI, אך הם כן מציעים מדי פעם כמה רעיונות שימושיים.

בדיקת ביטויי מתחרים

בין אם באמצעות כלים שונים ובין אם ידנית, בדיקת מתחרים יכולה לגלות לנו ביטויים קשורים נוספים שעליהם לא חשבנו.

בדיקת TF-IDF

ל-TF-IDF (תדירות מונח) אין שום קשר ל-LSI או ל-LSA, אך מדי פעם הוא יכול לחשוף מילים וביטויים שחסרים לנו.

מאגרי מידע

אתרים כגון ויקידאטה או ויקיפדיה הם מקורות נהדרים למציאת מונחים קשורים. גם גוגל משתמש בנתוניהם לצורך העשרת גרף הידע.

גרף הידע

גוגל מאחסנת קשרים בין אנשים, דברים ומושגים רבים בגרף הידע. תוצאות מתוך גרף הידע מופיעות לעתים קרובות גם בתוצאות החיפוש של גוגל.

חפשו את מילות המפתח שלכם ובדקו האם מופיעים נתונים כלשהם בגרף הידע. מכיוון שגוגל מקשר ביניהם כאשר מדובר בנושא הנדון, שווה לבדוק את זה.

ה-API של גוגל לשפה טבעית

מצאו את התוצאות הראשונות בגוגל, והדביקו את התוכן שלהם ב-API של גוגל לעיבוד שפה טבעית. חפשו ישויות רלוונטיות וחשובות מבחינה פוטנציאלית שאולי פספסתם.

עד כמה הפוסט הזה עזר לכם?

דירוג ממוצע 5 / 5. כמות דירוגים: 1

אף אחד עדיין לא דירג את הפוסט, אתם יכולים להיות הראשונים 🙂

אנחנו מצטערים לשמוע שהפוסט לא עזר לכם

נשמח לשפר את הפוסט

ספרו לנו איך נוכל לשפר אותו

Facebook
Twitter
LinkedIn
WhatsApp
Email
על הכותב

מוכנים להתקדם?

צרו איתנו קשר עוד היום ונשמח לעזור