Macht eine künstliche Intelligenz wie ChatGPT die klassische Content-Agentur und SEO-TexterInnen überflüssig? Oder stößt die KI in Sachen Texterstellung und SEO ohne weitere Ausarbeitung an Ihre Grenzen?
Diesen Fragestellungen sind wir mit einem kleinen Experiment nachgegangen. Dafür haben wir vor einigen Monaten einen Blogbeitrag in diesem Blog veröffentlicht, der zu 100 % von der KI konzipiert und verfasst wurde.
In diesem Beitrag möchten wir die Ergebnisse des Experiments präsentieren und überprüfen, ob die KI für die vollständige SEO-konforme Texterstellung erfolgsversprechend eingesetzt werden kann oder ob die Jobs von uns Texterinnen und Textern noch ein paar Jahre sicher sind …
Was kann ChatGPT für SEO leisten?
ChatGPT hat sich längst vom Trend hin zum festen Tool für Online-Marketer etabliert. Kein Wunder: Das KI-System bietet eine Vielzahl an hilfreichen Funktionen, welche die Erstellung von Content erleichtern. Dazu zählen z. B.:
- Recherche & Strukturierung: Vorarbeiten für SEO in Form von Keyword-Recherchen, Themenvorschlägen und der Erstellung von Headline-Strukturen.
- Texterstellung: Von Headlines und Metadaten über Social Media bis hin zu vollständigen Blogbeiträgen lässt sich alles mit ChatGPT umsetzen.
- Funfacts/Trivia: ChatGPT kann auch abseitige Informationen bieten, die Inhalte gut auflockern.
- Zielgruppenanalyse: Die KI hilft Ihnen dabei, ein besseres Verständnis für Ihre Zielgruppe zu gewinnen.
Insgesamt ist ChatGPT unter Nutzung der richtigen Befehle ein leistungsfähiges Tool, um Content-Marketing zu betreiben. Mehr dazu erfahren Sie in unserem Beitrag:
Das Experiment: SEO-Text von ChatGPT
Zunächst haben wir uns ein Thema ausgesucht, das relevantes Suchvolumen hat und gleichzeitig eher ein simpleres Definitionsthema ist. Dabei haben wir uns für das Thema Long-Tail-Keywords entschieden.
Sicherlich hätten wir auch hier schon die KI entscheiden lassen können. Allerdings wollten wir bewusst vermeiden, dass es zu einer Themendopplung kommt und all unsere vorhandenen Themen zu briefen, wäre vom Aufwand her doch immens geworden.
Die Recherche
In einem ersten Schritt haben wir von ChatGPT mit einem ausformulierten Prompt eine Struktur erstellen lassen. Wie das konkret abgelaufen ist, sehen Sie in diesem Screenshot:
Hier zeigt sich schon eine der Stärken von ChatGPT: Das Tool liefert in Rekordzeit eine brauchbare Headline-Struktur, die prinzipiell nur mit Leben gefüllt werden muss.
Allerdings sieht man hier schon ein kleines Problem: Der Fokusbegriff Long-Tail-Keywords taucht extrem häufig auf, insbesondere in den letzten Absätzen. Das könnte womöglich im späteren Verlauf Probleme geben und als Keyword-Stuffing angesehen werden.
Insgesamt sind wir persönlich mit der Recherchearbeit aber zufrieden. Auf dieser Basis lässt sich ein guter Text verfassen.
Die Texterstellung
Nun haben wir den Dialog mit der KI weitergeführt und das System auf Basis der Headline-Struktur einen Text mit Metadaten verfassen lassen. Auch dazu gibt es wieder einen Screenshot des Befehls und einen kurzen Textausschnitt:
Hier wurden bereits weitere Probleme sichtbar. ChatGPT hat während der Erstellung immer wieder abgebrochen und musste aktiv zum Weiterschreiben aufgefordert werden.
Obwohl insgesamt 1000 Wörter gefordert wurden, sind es gerade einmal 590 geworden. Auch die Meta-Description ist deutlich zu lang für die Vorgaben von Google. Selbst eine erneute Aufforderung brachte eine Meta-Description, die mit 170 Zeichen immer noch länger als erlaubt ist:
Insgesamt lief die Texterstellung also nicht ganz reibungslos ab. Am Ende ist aber zumindest genug Content entstanden. Wir wollten die Ergebnisse möglichst unverfälscht lassen, weshalb wir davon abgesehen haben, noch viele weitere Nachfragen zur Verlängerung der Inhalte zu stellen.
Die Bildrecherche
Was wäre ein Blogbeitrag ohne Titelbild? Auch hier haben wir ChatGPT konsultiert – und sicherheitshalber noch einmal nachgefragt:
Die passenden Bild-Metadaten haben wir uns ebenfalls mitliefern lassen:
Die Veröffentlichung
Damit war der Blogbeitrag fertig. Wir haben ihn nun noch in WordPress eingepflegt und am 30. März 2023, also vor ziemlich genau 4 Monaten, veröffentlicht.
Dabei haben wir auf jegliche Hinweise bezüglich der genutzten KI verzichtet und sogar einen unserer Texter als Verfasser angegeben, damit das Experiment nicht zu deutlich sichtbar ist.
Immerhin wollten wir durch einen Disclaimer nicht den Effekt erzielen, dass sich Menschen dann besonders für den Text interessieren. Es sollte wie ein normaler Blogbeitrag auf unserer Seite wirken.
Auswertung unseres ChatGPT SEO-Experiments
Zur Analyse und Auswertung möchten wir an dieser Stelle zwei Tools verwenden: Rank Math zur Beurteilung der Textqualität und Sistrix zur Auswertung der Performance in den Suchergebnissen. Beginnen wir mit der Qualität des Inhalts an sich.
Qualitätsbeurteilung mit Rank Math
Rank Math ist ein SEO-Plugin für WordPress, das die wichtigsten Faktoren der Suchmaschinenoptimierung im Backend prüft und direkt Optimierungen vorschlägt. Wir haben von der Auswertung des Tools einmal einen Screenshot gemacht:
Bis auf den etwas kurz geratenen Artikel – wobei das nicht zwangsweise ein Kriterium für Qualität ist – sind die grundlegenden Anforderungen erfüllt. Auch, dass keine externen oder internen Verlinkungen gesetzt wurden, kann man ChatGPT nicht verübeln. Dazu fehlt dem Tool schlichtweg die Möglichkeit.
Was jedoch gravierend auffällt, ist die Keyword-Dichte. Das hatte sich bereits bei der Headline-Struktur angedeutet und bestätigt sich leider im Text selbst auch. Insgesamt taucht der Begriff 36 mal auf, was eine Quote von über 6 % ausmacht. Das bedeutet: Etwa jedes 17. Wort ist das Fokus-Keyword.
Das ist schlichtweg zu viel und wirkt sich auch negativ auf die Lesbarkeit des Artikels aus. Hier sehen wir die Schuld bei der Art, wie ChatGPT Texte erstellt. Die KI geht nach einem Wahrscheinlichkeitsprinzip vor, mit dem abgeleitet wird, welcher Begriff besonders häufig als nächster im Satz auftaucht.
Logischerweise wird bei einem Artikel über Long-Tail-Keywords der Begriff Long-Tail-Keywords also eine hohe Wahrscheinlichkeit haben, in beinahe jedem oder jedem zweiten Satz aufzutauchen. Insgesamt wird eine so hohe Keyword-Dichte aber sicherlich Googles Alarmglocken schellen lassen.
Auswertung der Performance mit Sistrix
Zur Beurteilung der Performance in Sachen SEO nutzen wir das Tool Sistrix. Damit können wir die Sichtbarkeit beurteilen, die potenziellen organischen Aufrufe und für welche Keywords unser KI-Artikel auf welcher Platzierung rankt.
Selbstverständlich ist mit einem Blick in ein Tool noch nicht alles getan. Allerdings möchten wir unsere Auswertung auch nicht zu aufwendig gestalten, weshalb wir uns an dieser Stelle alleine auf Sistrix verlassen.
Mit Blick auf die Sichtbarkeit zeigt sich ein übliches, aber trauriges Bild. Zunächst dauert es bis zum 15. Mai, also gut 1,5 Monate, bis Google dem Artikel überhaupt eine gewisse Sichtbarkeit verschafft.
Das ist nicht ungewöhnlich. Es dauert immer ein wenig, bis neue Inhalte wahrgenommen und anschließend ausprobiert werden. Da wir als Blog schon eine gewisse Autorität und Vertrauenswürdigkeit bei Google aufgebaut haben, bekommt unser KI-Artikel eine Chance.
Für insgesamt einen Monat wird er scheinbar verstärkt ausgespielt und Suchenden präsentiert. Mit dem Ergebnis, dass die Sichtbarkeit ab Mitte Juni wieder bei null ankommt.
Das ist eine typische Kurve für Inhalte, die bei der Zielgruppe nicht punkten konnten. Google gibt ihnen eine Chance, probiert sie aus – und lässt sie im Zweifelsfall wieder abstürzen. So ist es jedenfalls mit unserem KI-Artikel abgelaufen.
Dieses Bild spiegelt sich auch in weiteren Statistiken wider:
Zwar klingt die Zahl der Keywords, für die der Artikel rankt, erst einmal nicht verkehrt. Der geschätzte organische Traffic zeigt allerdings, dass es sich dabei um schlechte Platzierungen handeln muss. Das bestätigt sich bei genauerem Blick auf die Keyword-Liste:
Keine Platzierung in den Top 10 und nur drei in den Top 20 sprechen eine deutliche Sprache: Der Text kam einfach nicht an. Die Angabe zum Wettbewerb beweist dabei, dass das Keyword an sich durchaus Potenzial für einen erfolgreichen Artikel bieten würde. Denn die Konkurrenzsituation ist überraschend dünn.
Dennoch hat unser ChatGPT-Artikel im Vergleich kein Land gesehen. Diese rudimentäre Analyse mit Sistrix zeigt, dass der Artikel keine organischen Aufrufe erzielt und es auch für die Zukunft nicht so aussieht, als würde sich daran etwas ändern.
Kurzum: Aus SEO-Sicht ist unser Artikel leider ein Fehlschlag.
Eine kurze Einordnung unseres SEO-Experiments
Wir erheben keinen Anspruch darauf, ein wissenschaftlich korrektes Experiment durchgeführt zu haben. Wir haben schlichtweg nach bestem Wissen und Gewissen durch ChatGPT einen Artikel verfassen lassen und ein paar Monate später die Performance geprüft.
Für gewöhnlich erzielen unsere Blogbeitrage schon wenige Wochen nach Veröffentlichung erste Ergebnisse und haben sich nach einigen Monaten fest in den SERPs etabliert. Entsprechend haben wir entschieden, dass ein Beobachtungszeitraum von 4 Monaten ausreichend ist.
Wir möchten einfach noch einmal klarstellen, dass wir keinen wissenschaftlichen Anspruch hinter diesem Experiment haben. Es ist nur aus Spaß am Ausprobieren neuer Tools entstanden und die Ergebnisse lassen sich nicht pauschalisieren und auf alle Anwendungsfälle übertragen.
Die Textqualität von ChatGPT hängt stark vom Briefing ab und wir haben in diesem Fall bewusst alles so naturbelassen wie möglich übernommen. Mit entsprechenden nachfragen und weiteren Tools ließe sich der Text problemlos weiter ausarbeiten. Dies war aber nicht der Ansatz unseres Experiments.
Wir bitten also, die Ergebnisse im entsprechenden Kontext zu sehen, dass wir hier keine Wissenschaft betreiben, sondern einfach für Sie ein Tool in einer einfachen Anwendung getestet haben.
Fazit: unsere Ergebnisse & Learnings
Ein naturbelassener, von ChatGPT verfasster Text zum Thema Long-Tail-Keywords hat es nicht geschafft, Traffic aufzubauen. Da die organischen Aufrufe bei 0 liegen, war die Zeit also in der Tat verschwendet. Denn ein Artikel ohne Aufrufe ist ein unnötiger Artikel.
Eine reine und ungeprüfte Texterstellung mit ChatGPT scheint in Sachen SEO nicht erfolgsversprechend zu sein. Wo Schatten ist, ist aber auch Licht. Denn es gibt einige Dinge, die ChatGPT in diesem Fall gut hinbekommen hat. Insbesondere die Recherche und Headline-Struktur haben als Ergebnis überzeugt.
Sämtliche erstellten Texte wiesen allerdings Mängel in der Länge und der Qualität auf. Entsprechend ist es nur logisch, dass der Text in Sachen SEO kein Land gesehen hat.
Hier zeigt sich mal wieder: ChatGPT ist nur ein Tool. Es ist nicht das einzige Tool. Und es ersetzt auch nicht den Menschen, der den erstellten Text noch einmal auf Herz und Nieren prüft.
Hätte man den erstellten Text als Grundlage verstanden und die Inhalte entsprechend geschliffen, ausgearbeitet und erweitert, dann hätte der Artikel sicherlich gute Chancen gehabt.
Das bedeutet abschließend: Von der ungeprüften Übernahme von Texten aus ChatGPT raten wir weiterhin ab. Jeder Text muss ausgiebig kontrolliert, überarbeitet und lektoriert werden. Nur so ist eine ausreichende Qualität und zielgruppengerechte Ansprache gewährleistet.
Die KI kann also schon viel. Den Menschen im redaktionellen SEO vollständig ersetzen, kann sie aber (noch) nicht!
Hinweis: Den Artikel zu Long-Tail-Keywords werden wir im Nachgang auf Basis der Vorarbeit von ChatGPT überarbeiten, um zu sehen, ob wir dann bessere Ergebnisse erzielen. Dafür werden wir den Artikel in der aktuellen Form für diesen Beitrag konservieren und diesen Artikel hier um die (hoffentlich besseren) Ergebnisse der menschlichen Optimierung ergänzen. Sobald das passiert ist, wird es entsprechende Hinweise geben.