Das Internet im Allgemeinen und die „Datenkrake“ Google im Speziellen sind ja gerne und oft Quell von Gerüchten und Panikszenarien. So brodeln immer wieder auch Thesen hoch, die so genannten Duplicate Content (DC) als Risikofaktor für Online PR und als Synonym für schlecht gerankte oder gar abgestrafte Unternehmenswebseiten sehen. Wir skizzieren kurz, um was es bei DC eigentlich geht, wo Gefahren doppelt oder mehrfach vorhandener Inhalte für die PR lauern und wie man sich dagegen wappnet.
Nichts liegt ferner, als uns im Folgenden als SEO/SEM Spezialist aufzuspielen – dies überlassen wir lieber den wirklichen Experten wie unseren Partnern. Dennoch ist es uns wichtig, mit ein paar immer wiederkehrenden „PR/Google-Gerüchten“ rund um DC aufzuräumen.
Duplicate Content – was ist das überhaupt?
Wie der Name unschwer vermuten lässt, versteht man bzw. Google unter Duplicate Content duplizierte bzw. ähnliche Inhalte, die entweder innerhalb einer Domain (interner DC) oder verteilt auf mehreren Webseiten im Netz (externer DC) zu finden sind:
- Intern auf der eigenen Unternehmensseite kann dies z.B. schnell geschehen über Filter-oder Kategorie-Seiten, Blogbeiträge und andere sich wiederholende Textpassagen innerhalb einer Homepage sowie sehr häufig über eigene Onlineshop- und Produktseiten oder verschiedenen Länderseiten gleichen Inhalts.
- Extern kommen eine Vielzahl von ursächlichen Stolperfallen hinzu: v.a. die Übernahme von Hersteller-Produktseiten z.B. über externe Shops oder Kaufempfehlungen, zudem über eingespielte RSS Feeds, die copy/paste Verbreitung über Affiliate Seiten, durch Content-Diebstahl so genannter Scraper Sites und ja, auch über verteilte Presseinformationen auf entsprechenden „PR“- und Recherche-Portalen.
Warum ist Google so DC-empfindlich?
Content bedeutet ja nicht nur Inhalt, sondern auch Gehalt: Demnach präferiert Google, einzigartigen und qualitativ hochwertigen Content, um Suchenden entsprechend ihrer Suchanfrage bestmögliche Ergebnisse und Mehrwerte zu liefern. Hierfür werden erhebliche Anstrengungen unternommen, um Seiten zu durchstöbern, zu analysieren, zu bewerten und zu indexieren. Wenn es nun mehrere Seiten gibt, die denselben oder beinahe identischen Inhalt haben, kann oftmals nur schwer ermittelt werden, welche die höchste Relevanz besitzt.
Die neuen Google Ranking Faktoren resultieren u.a. als Reaktion aus vergangenen Zeiten, als es sich so genannte Server- oder Linkfarmen zur Aufgabe gemacht haben, auf immer neuen Webseiten immer gleiche Unternehmensinhalte zu spiegeln und gegenseitig Backlinks zu erzeugen, um letztlich ein höheres Google Ranking zu erzielen. Dieses betrügerische Vorgehen unterbindet die „Chef-Suchmaschine“ heute strikt, was zugleich aber Nährboden für die DC-Gerüchteküche bietet, nachdem Google jeden abstraft, der doppelte Inhalte aufweist.
Wie wird DC ermittelt und „bestraft“?
Identische Inhalte müssen jedoch differenziert betrachtet werden, denn nicht gleich jede kopierte Textpassage fällt unter Duplicate Content. Erst ab cirka 500 Zeichen Text kommt man unter das „Radar“. Ebenso unterscheidet Google sehr genau bei internem DC – siehe oben. So stellen etwa länderspezifische Dubletten oder Dopplungen auf mobilen Seiten kein Problem dar oder können vom SEO/Web-Spezialisten mit ein paar einfachen Kniffen behoben werden.
Vor allem aber bei externem DC sieht Google genau hin und nimmt die ein oder andere Fremdseite vom Index, sprich aus der Relevanz einer möglichen Auffindbarkeit im Netz.
Wie wappne ich mich gegen DC Risiken?
An oberster Stelle auf der DC Prio-Liste für die Unternehmenskommunikation empfiehlt es sich, dem „Chef-Crawler“ Googlebot immer den eigenen Originalinhalt mitzuteilen. Denn Google erkennt zwar, dass es sich um Kopien handelt, versucht aber stets die jeweils relevanteste Seite zu finden. In der Praxis bedeutet dies: Es sollte nicht X-mal der gleiche Inhalt gefunden werden, sondern eben nur einmal.
Tipp 1:
Tauschen Sie sich deshalb regelmäßig mit Ihren Website- bzw. SEO-Verantwortlichen zu folgenden Stichworten aus: „Canonicals“, „Noindex“, „Robots.txt und Disallow“. Damit lässt sich steuern, ob und wie ein Crawler eine bestimmte Seite bewerten darf. So ermöglicht beispielsweise ein so genannter kanonischer Link ein einzelnes HTML-Dokument, dessen Inhalt sich auch auf anderen HTML-Dokumenten wiederfindet, als Originalquelle zu kennzeichnen.
Um besagte Problemseiten und -inhalte erst einmal zu identifizieren, empfiehlt sich zunächst ein gründliches Audit aller eigenen/Unternehmenswebseiten.
Tipp 2:
Hierzu können entweder diverse freie wie auch kostenpflichtige Tools verwendet werden:
- Die kostenpflichtigen Tools sollten Ihre Webmaster und SEO-Spezialisten idealerweise bereits im Portfolio haben, dies wären etwa Sistrix, Google Webmaster Tools oder onPage.org.
- Als kostenlose Helfer erweisen sich z.B. Screaming Frog oder Siteliner als sehr praktikabel, um Webseiten auf doppelte Inhalte schnell und einfach zu checken, inkl. einer detaillierten Auflistung der einzelnen Seiten mit Angaben zur prozentualen Übereinstimmung der Seiteninhalte.
Im Rahmen der klassischen Medienarbeit und Online PR hören wir vor dem Duplicate Content Hintergrund immer wieder eine entscheidende Frage: Wie gehe ich mit dem potentiellen DC-Kandidaten „Pressemitteilung“ um?
Hier reichen Gerüchte von abgestraften Presse- und Newsroom-Seiten, entsprechenden Sichtbarkeitsrisiken bis hin zu wenig praktikablen und realistischen Empfehlungen wie etwa zu jeder News mehrere unterschiedliche Textversionen bereitzustellen, sprich den eigenen Newsroom und marktübliche Presseportale zur weiteren Streuung mit variierenden Fassungen zu versorgen.
Tipp 3:
Beide Fälle gehören getrost in die Kategorie Panikszenario. Denn unter dem Strich ist es ja ein Zeichen guten Inhalts, dass er zitiert, kopiert und weiterverlinkt wird. So ist es ja auch die Intention einer Pressmitteilung, verbreitet und auf dritten Portalen publiziert zu werden – und das weiß Google auch. Das bedeutet: Für Sie als Absender besteht zunächst eher kein DC-Problem – anders als etwa für ein Dritt-Seiten wie PR-/Recherche-Portale, welche Ihre Inhalte 1:1 abbilden -, vorausgesetzt Sie beherzigen ein paar Basics.
Nicht selten würden manche SEO-Hardliner sogar die eigenen Presses-/Newsroom-Seiten bewusst vom Google Index nehmen lassen. Schließlich möchte man ja lieber mit hochwertigen Ratgeberbeiträgen und anderen, zum Unternehmen passenden, mehrwertigen thematischen Fangnetzen im Web gefunden werden, statt etwa mit einer nüchternen Produktmeldung im Google Search oben zu ranken. Soweit muss es jedoch gar nicht gehen. In jedem Falle sollten aber folgende DC-Quellen nicht weiter indiziert werden: Produkt- oder Kategorie-Unterseiten, Archive oder auch Affiliate-Seiten.
Der einfachste Weg im Kontext Unique Content & Pressemeldung ist: Achten Sie einfach immer darauf, dass Ihre News zuerst auf Ihrer Presseseite/Ihrem Newsroom „ON“ ist und erst mit zeitlicher Verzögerung – nach Google Indexierung – versandt und in anderen Presseportalen abgebildet wird. Zugleich sollten Sie Tipp 1 beherzigen und Ihre Meldung als Original-Content kenntlich machen.
Fazit
Manchmal lässt sich Duplicate Content in der Unternehmenskommunikation einfach nicht vermeiden oder ist gar fester Bestandteil eines Projekts bzw. des Wesens einer Homepage Struktur, in welcher sich einzelne Textabschnitte wiederholen.
Kurz und knapp auf den Punkt gebracht: Duplicate Content ist grundsätzlich nichts Schlimmes oder gar Strafbares. Nur wer vervielfältigte Inhalte zur Ranking Manipulation einsetzt, muss mit Google- und Sichtbarkeitskonsequenzen rechnen.
Für weitere Informationen zu Ranking Faktoren und SEO-Mythen empfehlen wir beispielsweise ab und an einen Blick ins SEO Blog von ContentManufaktur oder aus erster Hand immer gerne die zahlreichen Youtube-Ausführungen des Google- und SEO-Gurus, Matt Cutts. Natürlich freuen wir uns auch auf weitere Tipps zum Thema über Kommentare zu diesem Blogpost.
Interessante Zusammenfassung. Leider habe ich etwas nicht ganz verstanden: Bedeutet es für mich als Seitenbetreiber einer Hardware-Testseite nun, dass wenn ich den Text einer Pressemeldung 1:1 in einer Newsmeldung wiedergebe, das Google mich dafür nun abstraft?
Über eine Antwort würde ich mich sehr freuen.
MFG,
Mario
Hallo Mario, danke für Dein Feedback! Nach all dem, was wir zu dem Thema recherchiert und gelesen haben, würden wir zu Deiner Frage folgende, entwarnende Einschätzung geben:
1. Sinn einer Pressemeldung ist es ja geteilt und über andere Medienkanäle veröffentlicht zu werden, so auch in Eurem Newsbereich. Kritisch von der Sichtbarkeit her ist betrifft das ausschließliche 1:1 Abbilden einer News in besagten „Presse-/Recherche“-Portalen. Hier sind einige Domains von der Google Search Auffindbarkeit her seit Anfang 2015 sichtlich nach unten gegangen. Demnach sieht Google schon genau hin, was offizielles Medium oder was reines DC-Portal ist.
2. Hauptzweck des Tech-Review ist ja primär nicht Letzeres, sondern etwas Anderes. Und zwar wertige Produktbesprechungen mit entsprechend längerer Verweildauer der Leser/User auf den einzelnen Beiträgen. Also genau der Content, den Google mag 😉
PS. bzgl. Eurer Newsrubrik und der wiederum dortigen Unterseite, in der Ihr Pressemeldungsinhalte abbildet, möchtet Ihr ja sicher nicht Google-Top ranken…
Viele Grüße
Stefan