Was bedeutet Kookkurenz?

In den Sprachwissenschaften bedeutet Kookkurrenz (auch: Co-Occurence) das häufige gemeinsame Auftreten sprachlicher Einheiten, also etwa von Wörtern. Ein Beispiel ist „Haare schneiden“ und „Haare Shampoo“. Letzteres zeigt, dass zwei Wörter für eine Kookkurrenz nicht zwangsläufig direkt aufeinanderfolgen müssen. Es reicht, wenn sie signifikant häufig in relativer Nähe zueinander auftreten.

Das Wissen über Kookkurrenzen kann helfen, relevante Texte für Leser zu schreiben. Schreibt man zum Beispiel einen Text über Haarpflege, stößt man vielleicht auf die bereits genannte Co-Occurrence und erfährt damit mehr darüber, was Menschen eigentlich am jeweiligen Thema interessiert. Erste Hinweise auf Kookkurrenzen erhält man durch Google Suggest. Gibt man in die Suchmaschine beispielsweise den Begriff „Fußball“ ein, kombiniert Google ihn mit Wörtern wie „Europameisterschaft“ oder macht daraus „Fußballschuhe“.

Infografik zum Begriff Co-Occurrence

Infografik Co-Occurrence

Infografik zum Begriff Co-Occurrence

Was muss man beim Bestimmen von Kookkurrenz beachten?

Beim Schreiben eines Textes sollte man unter anderem darauf achten, dass nicht jede Kookkurrenz für den eigenen Text relevant ist. Das gilt insbesondere bei Wörtern mit mehreren Bedeutungen.

Ein Beispiel dafür ist das Wort „Läufer“, das als eins der deutschen Wörter mit den meisten unterschiedlichen Bedeutungen gilt. Ein Läufer kann natürlich ein Mensch sein, der gerade läuft. Aber „Läufer“ ist unter anderem auch eine Art Teppich sowie eine Schachfigur. Sucht eine Software nach Kookkurrenzen mit dem Wort „Läufer“, so kommen vielleicht Vorschläge wie „Läufer schlagen“, „Läufer Marathon“ oder „Läufer Patchwork“. Sie beziehen sich auf jeweils unterschiedliche Bedeutungen des Wortes. Je nachdem, über welche Art von Läufer man schreibt, wird man die eine Kookkurrenz nutzen und die andere ignorieren.

Was ist der Unterschied zwischen Kookkurrenz, Co-Citation, Kollektion und Kollokation?

Einige Wörter klingen ähnlich wie Kookkurrenz, meinen aber etwas völlig anderes. Kollektion ist so ein Wort. Kollektionen sind Zusammenstellungen von Waren, Texten, Daten oder Kleidung. Das hat nichts mit Kookkurrenz zu tun. Anders sieht das mit der Kollokation aus. Bei ihr handelt es sich um ein signifikant gehäuftes gemeinsames Auftreten mehrerer Wörter, die zusammen für einen Themenbereich besonders sinnvoll sind. Alle Kollokationen sind Kookkurrenzen, aber nicht alle Kookkurrenzen sind Kollokationen. In einer Lerneinheit der Universität Zürich werden Kookkurrenzen aus dem schweizerischen Zivilgesetzbuch als Beispiel für die Unterschiede genannt. „Massnahme zum Schutz“ (Schweizerdeutsch; ohne „ß“) ist eine Kollokation. Dagegen tritt auch „auf jeden Fall, aber“ gehäuft auf und ist damit eine Kookkurrenz, aber keine Kollokation.

Wieder etwas anderes ist die Co-Citation. Wenn Website X über Segelfliegen schreibt und Website Y und Z verlinkt, erkennt Google auch ohne direkte Verlinkung zwischen Y und Z, dass beide Seiten zu einem gemeinsamen Themenumfeld gehören.

Welche Relevanz hat Co-Occurrence für die SEO?

Baut man eine Seite über ein bestimmtes Thema, wie beispielsweise Barrierefreiheit, ist es für eine bessere Sichtbarkeit der Seite auf Google gut, Wörter zu kennen, die mit „barrierefrei“ eine Kookkurrenz und vor allem eine Kollokation bilden. Google nutzt in einem Text längst nicht mehr nur einzelne Keywordphrasen, um seine Relevanz für eine bestimmte Suchanfrage zu bewerten.

Die Suchmaschine schafft es immer besser, Inhalte ganzheitlich zu erfassen, um ihren Nutzern optimale Suchergebnisse zu präsentieren. Google Suggest verrät einem beispielsweise, dass Worte wie „wohnen“, „Bad“ und „Definition“ häufig in Verbindung mit „barrierefrei“ gesucht werden. Im Text sollte man also barrierefrei erst einmal definieren, barrierefreie Bäder thematisieren und auch darüber hinaus aufzeigen, wie barrierefreies Wohnen aussieht. Wörter wie „wohnen“, „Bad“ und „Definition“ sollten zudem häufiger im Text auftauchen.

Wie eine Kookkurrenz Matrix erstellen?

Eine Kookkurrenz-Matrix ist das Ergebnis einer Analyse, mit welchen anderen Wörtern ein vom Analysten gewähltes Wort besonders häufig in einem Text auftritt. Damit solch eine Analyse relevant für die Suchmaschinenoptimierung wird, muss man sinnvolle und sinnlose Kookkurrenzen trennen. Möglich wird die Analyse durch eine passende Software. Wie sie aussehen kann, zeigt zum Beispiel ein online gestelltes Programm des Leibniz-Instituts für Deutsche Sprache.

Für den Begriff „Photovoltaik“ findet es so sinnvolle Kookkurrenzen wie „Sonnenstrom“, „Wirkungsgrad“ und „Zukunftstechnologie“. Aber es tauchen auch Begriffe wie „Sachen“ oder „Gegensatz“ auf, die keine Relevanz für das Thema „Photovoltaik“ haben. Sie in einen Text über Photovoltaik zu integrieren, ist natürlich machbar. Aber Google wird den Text dadurch nicht als relevanter fürs Thema einstufen.

Einsatz von Co-Occurrence in der Praxis

Google ist im Laufe der Zeit immer intelligenter geworden und erfasst die Bedeutung eines Textes zunehmend ganzheitlich. Das hat Internetseiten mit reinen Keyword-Texten, die ausschließlich für Google geschrieben waren und für Menschen beim Lesen oft eine Qual waren, nahezu bedeutungslos gemacht.

Zugleich hat es die Suchmaschinenoptimierung verändert. Heute herrscht einerseits die Regel vor, dass Keywords die Lesbarkeit eines Textes nicht beeinträchtigen dürfen. Zugleich ist neben einem Haupt-Keyword sein semantisches Umfeld wichtig geworden, also Co-Occurrencen. Verschiedene SEO-Tools für das Schreiben suchmaschinenoptimierter Texte berücksichtigen das. Sie schlagen auf Basis eines Keywords automatisch Kookkurrenzen vor und analysieren zugleich ihre Integration in den Text.

Co-Occurrence und WDF*IDF

Die Co-Occurrence- und die und WDF*IDF-Analyse sind beide Methoden, um die Relevanz eines Textes für ein bestimmtes Thema zu beurteilen. WDF*IDF steht für „Within Document Frequency” und „Inverse Document Frequency”. WDF bestimmt die Relevanz eines Wortes innerhalb eines Textes, aber auf komplexere Weise als eine reine Analyse der Keyword-Häufigkeit. IDF dehnt den Blick über das Textdokument hinaus auf andere Textdokumente aus. Je eher ein Keyword im einen Text häufig und in anderen selten vorkommt, desto relevanter ist der Text für das mit dem Wort beschriebene Thema. Die WDF*IDF-Analyse kann dazu beitragen, das optimale semantische Umfeld für ein Keyword zu bestimmen.