תוכן משוכפל: איך הוא נוצר, כיצד הוא משפיע על האתר ואיך להימנע ממנו?

Facebook
Twitter
LinkedIn
WhatsApp
Email
תוכן עניינים

מהו תוכן משוכפל?

תוכן משוכפל הוא תוכן שמופיע באותה צורה, במספר עמודים או אתרים שונים. למשל אם היינו מפרסמים את הפוסט הזה גם תחת קטגוריית website-optimization, אז אותו עמוד היה נסרק גם בכתובת הנוכחית שלו שהיא https://www.masamedia.co.il/technical-seo/duplicate-content/ וגם בכתובת https://www.masamedia.co.il/website-optimization/duplicate-content/. במצב כזה, אותו תוכן בדיוק היה מופיע בשני עמודים שונים ויוצר שכפול.

למה תוכן משוכפל רע לקידום אתרים?

ישנן מספר סיבות לכך שתוכן משוכפל משפיע לרעה על הקידום האורגני בגוגל:

  • יוצר כתובות אתרים לא רצויות ו/או לא ידידותיות בתוצאות החיפוש.
  • גורם לדילול הכוח של קישורים נכנסים.
  • מבזבז תקציב זחילה.
  • גורם לגוגל להתעלם מעמודים באתר.

בואו נכנס לעומקו של כל סעיף ונבין את הבעייתיות שהוא יוצר.

כתובות אתרים לא רצויות או לא ידידותיות בתוצאות החיפוש

תארו לכם מצב שהפוסט הזה שאתם קוראים, זמין בשלוש גרסאות שונות כמו:

masamedia.co.il/technical-seo/duplicate-content/

masamedia.co.il/technical-seo/duplicate-content/?utm_content=buffer&utm_medium=social

masamedia.co.il/technical-seo/page/2/duplicate-content/

הגרסה הראשונה היא הגרסה העיקרית שאנחנו רוצים להציג. הגרסה השניה עשויה להיווצר מקמפיין ממומן ברשתות החברתיות, עם UTM שמתווסף לכתובת הדף, כדי למדוד בצורה מדויקת את מקור ההגעה. הגרסה השלישית נוצרת באופן אוטומטי מעמודי ארכיון של פוסטים.

כך, אותו תוכן עלול להיסרק שלוש פעמים מכיוונים שונים וליצור שכפול תוכן באתר. במידה ולא הוגדרו תגי קנוניקל בצורה תקינה, שלושת הכתובות הללו תיסרקנה על ידי הזחלנים והאלגוריתם יצטרך להחליט איזו מהן להציג בתוצאות. בעוד שהכתובת הראשונה היא נקייה, ברורה ומניעה יותר לפעולה, שתי הגרסאות האחרות ארוכות ועמוסות במילים ותווים לא רלוונטיים.

במקרים מסוימים, האלגוריתם בוחר דווקא את אחת משתי הגרסאות הפחות טובות ומציג אותן בתוצאות החיפוש, במקום ה-url שרצינו שיוצג. מכיוון שאנשים פחות נוטים ללחוץ על כתובות אתרים מסורבלות אשר נראות להם חשודות, ייתכן שזה יגרום לאתר לפספס תנועה אורגנית פוטנציאלית (מה שבתורו עשוי לפגוע ב-CTR שלו ולהתחיל כדור שלג עם השלכות שליליות על האתר).

דילול כוחם של קישורים נכנסים

אם אותו תוכן זמין ב-urlים שונים, אז כל אחד מהם הוא עמוד בפני עצמו, אשר מתחרה בעמודים אחרים עם אותו תוכן. כאשר מקשרים לגרסה אחת של העמוד, אין זה אומר שגם הגרסאות האחרות נהנות מהכוח. כך למשל, אתר חיצוני שרוצה לקשר אליכם, עשוי לקשר לגרסה אחרת מזו שאתם מעדיפים. במצב כזה אנחנו מפספסים קישור שיכול היה לחזק את העמוד שלנו, אך במקום זאת מכוון לעמוד אחר, ומדלל את כוחו של הקישור.

הנה דוגמה לכך מאחד האתר הפופולאריים בעולם – buffer.com:

עמוד social media manager checklist תחת resources:

עמוד בגרסה אחת מאתר באפר

אותו עמוד תחת קטגוריית library:

עמוד בגרסה שנייה מאתר באפר

ואיך זה נראה מאחורי הקלעים מבחינת הקישורים החיצוניים ששני העמודים הללו מקבלים?

אלו הם הנתונים של הגרסה הראשונה:

נתוני seo של עמוד אחד

ואלו של השניה:

נתוני seo של עמוד שני

 

כפי שניתן לראות, העובדה שהעמוד זמין בשני urlים שונים, גורמת לאתרים מבחוץ לקשר לשניהם. כך, אחד העמודים מקבל 144 קישורים מאתרים אחרים והשני עוד 106.

אם אותו עמוד היה נגיש רק בכתובת אחת, הוא היה זוכה לקישורים מ-250 אתרים שונים, מה שודאי היה עוזר לו להתמקם בתוצאה גבוהה יותר.

זיכרו שמדובר באותו עמוד ובאותו התוכן בדיוק, רק שהוא נמצא בשתי כתובות שונות, יוצר שכפול תוכן ומדלל את הכוח הפוטנציאלי שיכול היה להתרכז בדף אחד.

בזבוז תקציב הזחילה של האתר

גוגל מוצא תוכן חדש באתרים באמצעות סריקה, מה שאומר שהם עוקבים אחר קישורים מדפים קיימים לדפים חדשים. הם גם סורקים מחדש דפים קיימים מעת לעת כדי לראות אם משהו השתנה.

עמודים עם תוכן משוכפל מייצרים עבודה נוספת ומיותרת עבור הזחלנים, מה שעלול להשפיע לרעה על המהירות והתדירות שבה הם סורקים את הדפים החדשים או המעודכנים באתר.

התעלמות מעמודים באתר וירידה ברמת האיכות

לפעמים, בעלי אתרים שאינם מודעים לבעייתיות של תוכן משוכפל, משתמשים באותו תוכן במספר מקומות שונים. למשל עורך דין שמפרסם מאמר באתר כלכלי או חדשותי גדול, ומכיוון שהוא אוהב את התוצר ורוצה שהגולשים באתר שלו יחשפו אליו, הוא רואה לנכון לפרסם אותו גם בבלוג באתר שלו.

מה קורה במצב כזה? סביר להניח שגוגל יתן יותר קרדיט לאתר החדשותי או הכלכלי החזקים, על פני האתר של עורך הדין עצמו. כך יווצר מצב, שבו הפוסט שלו באתר החיצוני, יזכה לכל הקרדיט מגוגל על חשבון אותו הפוסט באתר הפרטי של העו״ד, שגוגל יתעלם ממנו, מכיוון שהוא כבר אינדקס את התוכן.

סביר להניח שהפוסט באתר החדשותי ידורג מעל אותו הפוסט באתר העו״ד וכך הוא מפסיד פעמיים – גם אתר החדשות מקבל את הטראפיק על חשבון האתר הפרטי של עורך הדין וגם הקרדיט הכולל של האתר הפרטי מגוגל יורד, משום שגוגל מזהה שהאתר מעתיק תכנים מאתרים אחרים ולא מייצר תוכן מקורי ואיכותי משל עצמו.

סיבות נפוצות להיווצרות תוכן משוכפל באתר וכיצד להתמודד עימן

לאחר שהזכרנו את ההשלכות השליליות שעלולות להיגרם כתוצאה מתוכן משוכפל והסברנו כיצד להימנע מכך, בואו נעבור על מצבים נפוצים שעשויים לגרום לשכפול תוכן וכיצד להתמודד איתם.

מסננים בעמודי מוצר

בעיה זו נפוצה באתרי איקומרס ונוצרת ברוב המקרים ללא ידיעת בעל האתר. בואו נראה דוגמה לכך:

אם נכנס לקטגוריית בגדי ים באתר של ג׳ק קובה, העמוד הראשי של הקטגוריה יהיה בכתובת הזו https://jack-kuba.co.il/swimwear.

אך אם נרצה לצפות רק בבגדי ים בצבע ורוד, נסמן את הבחירה שלנו ואז כתובת העמוד תשתנה, כדי לסנן את יתר התוצאות ולהציג רק בגדי ים בצבע ורוד: https://jack-kuba.co.il/swimwear?group_color=6075&p=1.

כתובות העמודים הן שונות וייחודיות, אך לא מתווסף שום תוכן חדש לאחר שבחרנו לסנן את כל הצבעים שהם לא ורוד. כך נוצר תוכן משוכפל, כאשר אותם מוצרים נמצאים בכתובות שונות.

הפתרון: הגדרת תגית קנוניקל לעמוד הראשי של הקטגוריה, על מנת שגוגל ידע להתעלם מהוריאציות החדשות שנוצרו כתוצאה מבחירת מסננים שונים ויאנדקס רק את הגרסה הראשית של העמוד.

פרמטרים של UTM

אתרים שעושים קמפיינים באפיקים שונים ורוצים למדוד בצורה מדויקת את התרומה של מודעות ופלטפורמות שונות, נוהגים להוסיף לקישורים המפנים לאתר תג UTM כדי לבדל את מקור ההגעה בצורה בולטת.

למשל אם נשלח לינק לאתר דרך הניוזלטר שלנו, ונרצה לראות כמה אנשים הגיעו לאתר באמצעות הלינק הזה וביצעו רכישה, אז כתובת הקישור שנשלח בניוזלטר תהיה משהו בסגנון הזה: masamedia.co.il/utm_source=newsletter.

בפועל, גולשים שהקליקו על הקישור בניוזלטר והגיעו לאתר, יראו בדפדפן שלהם את הכתובת הזו. מנקודת המבט של קידום אתרים אורגני זהו מצב בעייתי, שכן שוב נוצרת גרסה של url שלא שונה מהגרסה המקורית. אם לא ניתן לכך מענה, זה יצור תוכן משוכפל באתר.

הפתרון: כמו בסעיף לעיל – לוודא שיש תג קנוניקל תקין לכל עמוד עם קישור לכתובת הנקייה והמקורית של הדף.

HTTPS ו-HTTP, כתובות עם www וללא www

רוב האתרים נגישים באחת מארבע הגרסאות הבאות:

  • https://www.domain.co.il (HTTPS, www)
  • https://domain.co.il (HTTPS, ללא www)
  • https://www.domain.co.il (HTTP, www)
  • https://domain.co.il (HTTP, ללא www)

אם האתר שלכם מאובטח באמצעות תעודת ssl, הוא נגיש באמצעות שתי הדוגמאות הראשונות. אם האתר שלכם עדיין לא מאובטח, שתי הדוגמאות האחרונות עשויות להתרחש.

במידה וניתן לגשת לאתר שלכם במספר צורות, הרי שגם כמות העמודים תהיה כפולה ממה שהיא באמת (כי כל עמוד נסרק בשתי גרסאות שונות) ובכך ייווצר שכפול תוכן.

הפתרון: הגדרת הפניות 301 משתי האופציות שרלוונטיות אליכם, אל גרסה אחת ויחידה שתוכל להתקיים ולהיסרק על ידי גוגל.

אותיות גדולות וקטנות ב-URL

הזחלן של גוגל עושה הפרדה בין אותיות גדולות לאותיות קטנות (מנוע החיפוש של בינג לא עושה זאת). כלומר, אם יש לנו עמוד בכתובת הזו masamedia.co.il/seo ועמוד בכתובת masamedia.co.il/SEO, מבחינת גוגל אלו הם שני עמודים שונים. אם ניתן לגשת לעמוד גם בצורה אחת וגם בצורה השנייה, הרי שיש לכם שני עמודים עם אותו תוכן.

הפתרון: ראשית, להיות עקביים עם כתובות העמודים שאתם יוצרים. החליטו אם אתם הולכים על אותיות קטנות או גדולות והתמידו בכך.

שנית, להיות עקביים עם האופן שבו אתם מקשרים לעמודים באתר שלכם, בין אם מדובר בקישורים פנימיים ובין אם בקישורים נכנסים, כדי לא ליצור בטעות קישורים לעמודים שלא קיימים ובכך להיקלע לבעיית תוכן משוכפל.

אם זיהיתם שהבעיה כבר קיימת באתר שלכם, תוכלו לפתור אותה באמצעות הפניית 301 והגדרת תג קנוניקל לכתובת בפורמט ספציפי בלבד.

כתובות עם לוכסן ובלי לוכסן בסופן

גוגל מתייחס לכתובות עמודים עם לוכסן בסופן כעמודים נפרדים מעמודים באותה כתובת שמסתיימות ללא לוכסן. לדוגמה:
masamedia.co.il/
masamedia.co.il

אם עמודי האתר נגישים בשתי הוריאציות, זה יכול להוביל לבעיות שכפול תוכן. ניתן לבחון זאת בקלות על ידי הקלדת כתובת האתר שלכם עם ובלי הלוכסן. במידה ובשתי האפשרויות אתם מגיעים לאותה תוצאה, סימן שהכל תקין. אם בשני הניסיונות האתר שלכם היה נגיש בצורה שונה – יש לכם בעיית שכפול תוכן.

הפתרון: המקור לבעיה יכול לנבוע מתוספים שמתנגשים עם הגדרות שרת מסוימות (למשל wp rocket הפופולארי עלול לגרום לכך), הגדרות לא נכונות בבסיס הנתונים ועוד. לכן, חשוב תחילה לאתר את מקור הבעיה על מנת לדעת כיצד לפתור אותה. אם הבעיה מתרחשת במספר מצומצם של עמודים ואתם מחפשים פתרון מהיר, תוכלו לבצע הפניית 301 אל התצורה הרצויה של ה-url.

אתרים עם גרסאות מובייל ייעודיות

ישנם אתרים שגרסת המחשב שלהם לא ידידותית לנייד או שהעדיפו לבנות אתר ייעודי לגולשים ממכשירים ניידים, כדי להוסיף פונקציונליות מסויימת או לגרוע חלק מהאפשרויות לעומת גרסת הדסקטופ.

ניקח לדוגמה אתר שכולנו מכירים – פייסבוק. ניתן לגשת לפייסבוק בכתובת facebook.com וגם בכתובת m.facebook.com מכל מכשיר. מצב כזה, ללא הגדרה נכונה, מייצר שכפול תוכן של כל עמודי האתר.

פייסבוק בגרסת דסקטופ לעומת מובייל

הפתרון: ראשית, הגדרת כל עמודי האתר הנייד או הנייח בתג קנוניקל לגרסה שרוצים שתיסרק על ידי גוגל (העדפה לגרסת הנייד, שכן גוגל סורק אתרים בעיניים של גולשי מובייל). שנית, הוספת תג rel=“alternate” שאומר לגוגל שגרסת המובייל היא גרסה אלטרנטיבית של האתר הרגיל, המיועדת עבור גולשים ממכשירים ניידים.

עמודי AMP

AMP היא טכנולוגיה המאפשרת להציג גרסאות רזות ומהירות של אתרים לטובת גולשי המובייל. גוגל אימצו אותה בחום, ובעוד שבפני עצמה היא דבר נהדר, חשוב לשים לב שהיא לא יוצרת בעיות תוכל משוכפל באתר.

אם יש עמודי amp באתר שלכם, אז לכל עמוד יש גרסת amp בכתובת ייעודית. כך זה נראה בדרך כלל:

  • /domain.co.il/page
  • /domain.co.il/amp/page

כפי שכבר ודאי ניחשתם – זה יוצר תוכן משוכפל.

הפתרון: כמעט כמו תמיד, קודם כל יישום תג קנוניקל בגרסת ה-AMP שמפנה לגרסה הרגילה. שנית, הוספת תג rel="amphtml" אשר אומר לגוגל שזוהי גרסה אלטרנטיבית ורזה, אשר מותאמת amp, ושעליו להתייחס לתוכן בגרסת העמוד המקורית.

עמודי ארכיון, תגים וקטגוריות

בעיה שנפוצה מאוד באתרי וורדפרס. כאשר יוצרים פוסט באתר, ניתן לשייך אותו לקטגוריה כלשהי ולהוסיף לו תגיות שונות אשר רלוונטיות לנושא שלו. בנוסף, כל פוסט נוצר על ידי משתמש מסויים ובתאריך מסוים. באופן אוטומטי, נוצרים עמודי קטגוריות ועמודי ארכיון מבוססי תאריכים, תגיות ומחברים. בברירת המחדל, כל העמודים הללו פתוחים לסריקה של מנועי החיפוש.

כך למשל אם היינו משתמשים בתג seo tips ומוסיפים אותו לפוסטים שונים באתר, אז התוכן בעמודים היה נגיש גם בעמודים עצמם וגם בעמוד הארכיון של התג seo tips. כך זה היה נראה בפועל:

עמוד בכתובת לדוגמה שמכיל את התג: masamedia.co.il/seo-guide

עמוד נוסף בכתובת לדוגמה שמכיל את התג: masamedia.co.il/organic-seo

וכך היה נראה עמוד התג עצמו: masamedia.co.il/tag/seo-tips

כלומר עמוד התג היה מכיל בתוכו את כל התוכן שקיים כבר בעמודים עצמם שעושים שימוש בתג. כל התוכן בעמוד שלו היה נסרק כתוכן משוכפל.

הפתרון: ראשית אנו ממליצים להימנע לחלוטין משימוש בתגים, מהסיבה הפשוטה שאין להם שום ערך אמיתי לקידום אורגני. שנית, כחלק מהגדרות תוסף ה-SEO שלכם, הקפידו להגדיר את עמודי הארכיון, התגים והקטגוריות כ-noindex. במידה ועמודי הקטגוריות הם משמעותיים באתר, למשל באתר איקומרס, ההמלצה שלנו היא להוסיף להם תוכן ייחודי, באורך של 250 מילה לפחות, כדי שלא יהיו רק אוסף מוצרים קיימים ואז לאפשר להם להיסרק ולהתאנדקס על ידי גוגל.

כתובות עמודי מדיה

עוד בעיה שנפוצה בעיקר באתרי וורדפרס, היא שכל קובץ מדיה אשר עולה לאתר, מקבל url משלו. כלומר אם כתבנו את הפוסט הזה והטמענו בו תמונות, לכל תמונה כזאת נוצר עמוד בכתובת ייחודית שאין בו כלום פרט לתמונה עצמה. מכיוון שכל עמודי המדיה למעשה זהים בעיני גוגל, הוא רואה אותם גם כתוכן משוכפל וגם כעמודים רזים ללא ערך לגולש. שתי בעיות שרצוי להימנע מהן.

עד כמה זה משמעותי? בשנת 2018 גרסה חדשה של יוסט הגיעה בטעות עם הגדרת ברירת מחדל אשר מאפשרת לגוגל לסרוק את כל עמודי המדיה. הדבר גרם במהרה לכאוס בקרב משתמשי התוסף ואתרים רבים דיווחי על ירידות חדות במיקומים ובטראפיק האורגני שלהם כתוצאה מכך. הבאג תוקן במהרה בעדכון גרסה ובכך הסתיימה הסאגה.

הפתרון: למרבה המזל יש לבעיה הזו פתרון פשוט ומהיר. כל מה שצריך לעשות הוא להיכנס לתוסף Yoast SEO, לנווט אל תצוגת חיפוש, לבחור בלשונית מדיה ולוודא שתחת ״האם להפנות מעמודי קבצים מצורפים לקובץ עצמו?״ מסומנת התשובה ״כן״.

הפניית עמודי מדיה בתוסף יוסט

התוסף יבצע הפניה אוטומטית מעמוד המדיה שנוצר, אל הפוסט שמכיל את אותה המדיה ובכך ימנע שכפול תוכן וריבוי עמודים רזים באתר.

סביבות פיתוח

סביבת פיתוח היא העתק מדוייק של האתר שלכם אשר נמצא על דומיין שונה. כמובן שעדיף לעבוד על סביבת פיתוח ולאחר מכן לייצא את השינויים לאתר החי, אך כאשר לא מקפידים לסגור אותה לסריקה של מנועי החיפוש, נוצר שכפול תוכן מלא של האתר שלכם באתר חיצוני.

הפתרון: הגדרת סביבת הפיתוח באופן גורף בתגיות noindex ו-nofollow כדי שגוגל לא יסרוק ולא יאנדקס אף עמוד מסביבת הפיתוח.

לסיכום

האתר שלכם עשוי לסבול מבעיות שכפול תוכן מבלי שתהיו מודעים לכך כלל או בשל פעולות שביצעתם מבלי שהכרתם את ההשלכות שלהן. חשוב לזכור, כי באופן רשמי גוגל טוענת שהיא אינה מענישה אתרים רק על עצם הימצאותו של תוכן משוכפל, אלא רק כאשר מדובר בניסיון בולט לבצע מניפולציה באלגוריתם. בפועל, אתם לא רוצים להיות נתונים לחסדיו של הבוט שיחליט האם ביצעתם ניסיון להתל באלגוריתם או שפעלתם בתום לב.

אנו ממליצים לשים לב לנקודות שהעלנו בפוסט ולוודא שהתוכן באתר שלכם נשאר מקורי וייחודי בכל עמוד. ניתן לבדוק האם יש תוכן משוכפל באתרכם, בצורה פשוטה וחינמית באופן חלקי, על ידי כלים כמו copyscape ו-siteliner. החדשות הטובות, כפי שכנראה הבנתם מהפוסט הזה, הם שגם אם שגיתם, אפשר לתקן ולהמשיך קדימה.

עד כמה הפוסט הזה עזר לכם?

דירוג ממוצע 0 / 5. כמות דירוגים: 0

אף אחד עדיין לא דירג את הפוסט, אתם יכולים להיות הראשונים 🙂

אנחנו מצטערים לשמוע שהפוסט לא עזר לכם

נשמח לשפר את הפוסט

ספרו לנו איך נוכל לשפר אותו

Facebook
Twitter
LinkedIn
WhatsApp
Email
על הכותב

מוכנים להתקדם?

צרו איתנו קשר עוד היום ונשמח לעזור