Was ist Duplicate Content?

Bei Duplicate Content (doppelter oder duplizierter Inhalt) oder Kurz „DC“ handelt es sich um identische Inhalte auf verschiedenen Websites oder URLs. Hierbei wird zwischen internen bzw. externen Duplicate Content unterschieden. Befinden sich auf verschiedenen URLs identische Textpassagen, kann dies als Duplicate Content erkannt werden.

Duplicate Content in einem Video erklärt


In diesem Video erklären wir den Begriff „Duplicate Content“

Warum ist Duplicate Content ein Problem?

Suchmaschinen möchten für Ihre Nutzer den bestmöglichen Inhalt ausspielen, dabei sollen die Ergebnisse in den Serps auch vielfältig sein. Gleicher oder ähnlicher Inhalt bietet dem Nutzer weniger Mehrwert, die Nutzerzufriedenheit sinkt. Daher kann Duplicate Content zu Rankingproblemen führen. Google ist daran interessiert das Crawl-Budget so effektiv wie möglich einzusetzen, da Rechenleistung dem Unternehmen Geld kosten.

Ab wann ist Duplicate Content ein Problem?

Interner Duplicate Content kann z.B. dann zu einem Problem werden, wenn sich mehrere URLs Ihrer Website um ein oder mehrere Keywords im Ranking behindern. Man spricht hier von der Keyword Kanabalisierung, d.h. Google kann dann nicht exakt entscheiden welche der URLs maßgebend für das Ranking sein soll, dadurch teilen Sie mehrere Platzierungen zu einem Keyword mit unterschiedlichen URLs.

Bestraft Google Duplicate Content?

Eine direkte Penalty für internen Duplicate Content gibt es nicht, viel mehr verhindern Sie den Aufbau guter Rankings durch die Keyword Kanabalisierung. Für externen Duplicate Content werden seitens Google Penalties erhängt:

  • Scraper Sites: Websites die Content eins zu eins automatisiert kopieren, und dem Nutzer keinen Mehrwert bieten
  • Spinning Content: Der gescrapte Content wird automatisiert sowie individualisiert, man spricht vom Article Spinning
  • Doorway Pages: Sogenannte Brückenseiten die auch als Black Hat Methode zählen

Beispiele von internen Duplicate Content

Auf der eigenen Seite kann Duplicate Content entstehen, wenn:

  • Eine Seite über mehrere URLs erreichbar ist, z.b. mit oder ohne www, mit oder ohne http/https, mit verschiedenen Filter/Parametern
  • Seiten die auch als Druckversion zur Verfügung gestellt werden
  • Falsche Paginierung
  • Website existiert in gleicher Form auch als mobile Version (nicht responsiv gemeint!)
  • Tag-Übersichten oder Filter-Übersichten
  • Groß- und Kleinschreibung in URLs
  • Neue Seiten werden erstellt wohingegen alte nicht weitergeleitet werden
  • Entwicklungsumgebungen
  • Interne Suchergebnisseiten
  • Trailing Slash „/“
  • Ein und dasselbe Produkt, oder ein Beitrag, in verschiedenen Kategorien zugeordnet und unter verschiedenen URLs auffindbar

Beispiele von externen Duplicate Content

Durch externe Websites oder deren URLs kann Duplicate Content entstehen, z.b. wenn:

  • Produktbeschreibungen von Herstellern werden eins zu eins kopiert
  • Diebstahl von Content/Beiträgen
  • Inhalte die durch einen Feed (RSS) eingespielt werden
  • Scraping von Content und Vervielfältigung durch Article Spinning
  • Verbreitung von Pressemitteilungen
  • Teilen von Inhalten, oder Nutzung dieser, im Affiliate Bereich
  • Content-Kooperationen, die Inhalte auf anderen Seiten teilen
  • Auf verschiedenen Länderversionen die Nutzung gleicher Inhalte

Weitere Klassifizierungen von Duplicate Content

  • Exakt Duplicate Content
    Inhalte und ggf. auch das Design existieren exakt in selbiger Form auf verschiedenen URLs
  • Partial Duplicate Content
    Ein großer Teil von gleichen Inhalten ist auf verschiedenen URLs abrufbar
  • Near Duplicate Content
    Inhalte sind nicht exakt eins zu eins kopiert, sagen aber gleiches wie auf anderen URLs aus oder sind in Teilen leicht verändert

Wie Duplicate Content finden?

Eine einfache Methode, um externen Duplicate Content zu finden, kann das Eingeben einer Suchphrase mittels Anführungszeichen sein

Google Suche mit Anführungszeichen

Abbildung 1: Suche von externen Duplikaten durch Anführungszeichen

Um internen Duplicate Content zu finden, ergibt sich die Möglichkeit durch die site: – Abfrage:

Interne Duplikate finden

Abbildung 2: Google Site Abfrage für interne Duplikate

Duplicate Content Prüfung durch Tools

Copyscape (https://www.copyscape.com/)
Mittels dem kostenfreien Tool Copyscape können Sie eine Website oder URL auf Duplikate prüfen

Copyscape Duplicate Content

Abbildung 3: Das kostenlose Duplicate Content Tool Copyscape

Siteliner Duplicate Content Tool

Abbildung 4: Siteliner Tool

„Ausgeschlossene“ URLs abzufragen, um zu erfahren welche Seiten Google als Duplikat einstuft. Mit klick auf das URL Prüfungstool erhalten Sie die notwendigen Informationen welche Seiten gleichermassen eingestuft werden.

Ausgeschlossene URL in GSC

Abbildung 5: Ausgeschlossene URL in Google Search Console

GSC ausgeschlossene URL

Abbildung 6: Kategorisierung von ausgeschlossenen URLs

Weitere Tools zur Prüfung von Duplicate Content:

Was können Sie gegen Duplicate Content tun?

  • Sofern es sich um einen geklauten Content Ihrerseits handelt, so haben Sie die Möglichkeit einen SPAM Report an Google zu melden, sofern keine Kontaktmöglichkeit zum Webmaster der Seite besteht (https://www.google.com/webmasters/tools/spamreport). Andernfalls empfiehlt es sich den Webmaster der Seite zu kontaktieren und um Löschung oder Veränderung des Inhalts zu bitten. Inhalte, welche weiterhin bestehen bleiben, sollten durch einen Rechtsanwalt, auf Berufung Ihres Copyrights, geahndet werden.
  • Achten Sie auf die Struktur Ihrer Website. Diese sollte bestmöglich Einzigartig sein, d.h. legen Sie sich klar darauf fest ob Ihre Seite mit oder ohne www erreichbar sein soll. Sofern Sie eine SSL Verschlüsselung einsetzen, empfiehlt es sich die Seite nur unter https erreichbar zu machen. Inhalte und Kategorien sollten klar strukturiert sein. Haben Sie einen Artikel in verschiedenen Varianten, achten Sie dennoch darauf dass dieses Produkt im Idealfall nur einmal als URL existiert.
  • Verwenden Sie Canonical Tags um den Suchmaschinen klar aufzueigen, welche Seite die Originale bzw. relevante Seite für den Inhalt ist
  • Achten Sie bei der internen Verlinkung auf Konistenz
  • Steuern Sie das Crawling Ihrer Seite mit Hilfe der Robots.txt zum Ausschluss von Kategorien die nicht indexiert werden sollen bzw. von Testumgebungen. Weitere Möglichkeiten sind auch die Meta-Tags noindex bzw. nofollow
  • Richten Sie für die Aufbereitung neuen Contents 301 Weiterleitungen auf die alte URL ein, selbiges auch bei einem Website-Relaunch
  • Minimieren Sie wiederkehrende Textbausteine, z.B. im Footer, Kategorien
  • Gerade im D-A-CH Raum, aber auch bei der internationalen Ausrichten sollten Sie den hreflang verwenden
  • Erstellen Sie thematisch eindeutige Seiten, bestmöglich zu einem Thema eine allumfassenden Content
  • Kopieren Sie keine Inhalte oder schreiben Sie Inhalte nicht einfach nur um
  • Sofern Sie neue Inhalte publizieren, haben gerade neue Seiten (welche nicht so häufig gecrawlt werden) die Möglichkeit diese an den Index zu senden

Fazit

Auch wenn Google nach eigenen Angaben bemüht ist Duplicate Content zu erkennen und automatisiert zu filtern, so sollten Sie dieses Thema in der Suchmaschinenoptimierung (SEO) als wichtigen Bestandteil betrachten. Duplikate, welche für den User letztendlich keinen Mehrwert darstellen, führen sowohl beim Nutzer als auch bei den Suchmaschinen zu keiner Zufriedenheit. Das Crawl-Budget sollte dahingehend sinnvoll eingesetzt werden, um Webseiten welche für ein Ranking wichtig sind, im Fokus zu haben.

Google zu doppelten Inhalten: https://support.google.com/webmasters/answer/66359?hl=de