GEO: Generative Engine Optimization — Das Grundlagenpapier, vereinfacht erklärt

Basierend auf dem Paper "GEO: Generative Engine Optimization" von Aggarwal, Murahari, Rajpurohit, Kalyan, Narasimhan & Deshpande (Princeton University / IIT Delhi). Veröffentlicht auf der KDD 2024.

Paper: arXiv:2311.09735 | Code: github.com/GEO-optim/GEO


Das Problem: KI-Suche vernichtet den Web-Traffic

25 Jahre lang erhielten Sie bei einer Google-Suche eine Liste blauer Links. Sie klickten auf einen davon, besuchten eine Website, und der Website-Betreiber bekam Traffic. Alle waren zufrieden.

Dann kamen die generativen Suchmaschinen — Tools wie ChatGPT, Perplexity, Google AI Overviews und Bing Copilot. Statt Ihnen Links zu geben, lesen sie mehrere Websites, synthetisieren die Informationen und geben Ihnen eine direkte Antwort. Sie erhalten, was Sie brauchen, ohne jemals zur Originalquelle zu klicken.

Das ist grossartig für Nutzer. Aber es ist eine Katastrophe für die Millionen von Websites, Blogs, kleinen Unternehmen und Content-Erstellern, die von diesem Traffic leben.

Die Forscher hinter diesem Paper haben drei Stakeholder in dieser neuen Welt identifiziert:

  1. Die Nutzer — sie gewinnen (schnellere und bessere Antworten)
  2. Die Anbieter generativer Suchmaschinen — sie gewinnen (mehr Nutzer, mehr Einnahmen)
  3. Die Content-Ersteller — sie verlieren (weniger Traffic, weniger Sichtbarkeit)

Das Paper stellt eine einfache Frage: Können Content-Ersteller etwas dagegen tun?


Was ist GEO?

Generative Engine Optimization (GEO) ist das neue Äquivalent von SEO, aber für KI-gestützte Suchmaschinen.

  • SEO = Ihren Inhalt optimieren, damit Google ihn höher in seiner Linkliste platziert
  • GEO = Ihren Inhalt optimieren, damit KI-Suchmaschinen ihn häufiger zitieren und sichtbarer in ihren generierten Antworten verwenden

Der entscheidende Unterschied: Bei der traditionellen Suche bedeutet Sichtbarkeit "weiter oben in einer Rangliste erscheinen." Bei der generativen Suche bedeutet Sichtbarkeit "welcher Anteil der KI-Antwort stammt aus Ihrem Inhalt und werden Sie kreditiert."


Wie generative Suchmaschinen wirklich funktionieren

Das Paper formalisiert, was sie als Generative Engine (GE) bezeichnen. Hier ist die vereinfachte Pipeline:

  1. Sie stellen eine Frage (z.B.: "Was ist das Geheimnis der Schweizer Schokolade?")
  2. Die Suchmaschine formuliert Ihre Anfrage um in einfachere Unteranfragen, die leichter zu recherchieren sind
  3. Eine traditionelle Suchmaschine (wie Google) ruft die relevantesten Webseiten ab
  4. Ein LLM fasst jede Quelle zusammen
  5. Ein weiteres LLM generiert eine finale Antwort, die Informationen aus mehreren Quellen mit Inline-Zitaten verwebt

Das Ergebnis ist eine reichhaltige, strukturierte Antwort — keine Linkliste. Ihre Website ist möglicherweise eine der verwendeten Quellen, aber der Nutzer wird sie vielleicht nie besuchen.


Die grosse Herausforderung: Wie misst man Sichtbarkeit?

Bei Google ist Sichtbarkeit einfach: Welche Position haben Sie auf der Ergebnisseite? Position 1 erhält ~36% der Klicks, Position 10 fast nichts.

Bei generativen Suchmaschinen ist es viel komplexer. Ihr Inhalt kann:

  • Einmal oben in der Antwort zitiert werden (hohe Sichtbarkeit)
  • Fünfmal zitiert werden, aber am Ende vergraben (mittlere Sichtbarkeit)
  • Verwendet werden, um die Antwort zu informieren, aber nie explizit zitiert werden (null Sichtbarkeit)

Die Forscher haben drei Methoden zur Messung der Sichtbarkeit vorgeschlagen:

1. Wortzahl (Word Count)

Wie viele Wörter in der KI-Antwort werden Ihrer Quelle zugeordnet, im Verhältnis zur Gesamtantwort? Mehr Wörter = mehr Sichtbarkeit.

2. Positionsgewichtete Wortzahl

Dasselbe, aber Wörter, die früher in der Antwort erscheinen, zählen mehr (weil Menschen den Anfang aufmerksamer lesen). Dies verwendet eine exponentielle Abnahme — als Erster zitiert zu werden ist viel wertvoller als als Letzter.

3. Subjektiver Eindruck

Ein mehrdimensionaler Score, der abdeckt: Relevanz für die Anfrage, Einfluss auf die Antwort, Einzigartigkeit Ihres Beitrags, Wahrscheinlichkeit, dass der Nutzer auf Ihr Zitat klickt, und Vielfalt des präsentierten Materials.


Die 9 getesteten Optimierungsstrategien

Die Forscher testeten 9 verschiedene Methoden zur Modifikation von Website-Inhalten und massen, ob jede die Sichtbarkeit in den Antworten generativer Suchmaschinen verbesserte.

Was nicht funktioniert

Strategie Was sie bewirkt Ergebnis
Keyword-Stuffing Mehr Anfrage-Keywords in Ihren Inhalt einfügen Schlechter als nichts tun. Der Lieblingstrick des traditionellen SEO ist hier nutzlos — LLMs verstehen Bedeutung, nicht nur Keywords.
Einzigartige Wörter Seltenes/ungewöhnliches Vokabular hinzufügen Keine signifikante Verbesserung.

Was funktioniert

Strategie Was sie bewirkt Verbesserung
Zitate hinzufügen Relevante Zitate aus glaubwürdigen Quellen einfügen +40% Sichtbarkeit (bestes Ergebnis)
Statistiken hinzufügen Vage Behauptungen durch präzise Zahlen und Daten ersetzen +30% Sichtbarkeit
Quellen zitieren Referenzen und Zitate zu autoritativen Quellen hinzufügen +27% Sichtbarkeit
Lesbarkeitsoptimierung Die Lesbarkeit und den Textfluss verbessern +25% Sichtbarkeit
Fachbegriffe Präzise, domänenspezifische Terminologie verwenden +15% Sichtbarkeit
Leicht verständlich Die Sprache für breitere Zugänglichkeit vereinfachen +14% Sichtbarkeit
Autoritativer Ton In einem überzeugenderen, selbstbewussteren Stil schreiben +10% Sichtbarkeit

Die drei besten Strategien haben eines gemeinsam: Sie fügen Glaubwürdigkeitssignale hinzu. Zitate, Statistiken und Referenzen machen den Inhalt vertrauenswürdiger — und generative Suchmaschinen belohnen das.


Die überraschendste Entdeckung: GEO hilft den Kleinen

Als die Forscher testeten, was passiert, wenn alle Websites gleichzeitig optimieren, fanden sie etwas Bemerkenswertes:

  • Websites auf Google-Platz #5 (die Aussenseiter) sahen Sichtbarkeitsgewinne von bis zu +115%
  • Websites auf Google-Platz #1 (die grossen Akteure) sahen ihre Sichtbarkeit um 30% sinken

Warum? Traditionelle Google-Rankings hängen stark von Backlinks, Domain-Autorität und Markenbekanntheit ab — Dinge, die grosse Unternehmen begünstigen. Aber generative Suchmaschinen achten mehr auf Inhaltsqualität. Wenn ein kleiner Blog solide Zitate und Statistiken hinzufügt, behandelt die KI ihn genauso ernst wie die Website eines DAX-Konzerns.

Das ist potenziell ein grosser Gleichmacher für unabhängige Autoren und kleine Unternehmen.


Die Branche zählt: Eine Grösse passt nicht allen

Die effektivsten Strategien hängen von Ihrem Thema ab:

Strategie Funktioniert am besten für
Autoritativer Ton Debattenthemen, Geschichte, Wissenschaft
Lesbarkeitsoptimierung Business, Wissenschaft, Gesundheit
Quellen zitieren Faktische Behauptungen, Recht & Verwaltung
Zitate hinzufügen Gesellschaft, Erklärungen, Geschichte
Statistiken hinzufügen Recht & Verwaltung, Debatte, Meinungsartikel

Ein Rechts-Blog sollte sich auf das Hinzufügen von Statistiken und Zitaten konzentrieren. Eine Geschichts-Website sollte direkte Zitate einfügen. Eine Gesundheits-Website sollte die Lesbarkeit verbessern. Es gibt keine universell "beste" Strategie.


Strategien kombinieren funktioniert noch besser

Die Forscher testeten auch Strategiepaare gemeinsam. Die Gewinnerkombination:

Lesbarkeitsoptimierung + Statistiken hinzufügen = +35,8% Sichtbarkeit

Das übertrifft jede Einzelstrategie um mehr als 5 Prozentpunkte. Die Lektion: Wählen Sie nicht nur einen einzigen Ansatz — kombinieren Sie sie.

Referenzen in Kombination mit anderen Methoden hinzuzufügen war ebenfalls besonders wirkungsvoll. Obwohl "Quellen zitieren" allein nicht der beste Performer war, steigerte es die Ergebnisse in Kombination mit anderen Strategien systematisch (Durchschnitt +31,4% in Kombination).


Validierung unter realen Bedingungen: Es funktioniert auch auf Perplexity.ai

Die Forscher testeten nicht nur auf ihrer eigenen simulierten Suchmaschine. Sie führten auch Experimente auf Perplexity.ai durch, einer echten generativen Suchmaschine mit Millionen von Nutzern.

Die Ergebnisse halten stand:

  • Zitate hinzufügen: +22% bei der positionsgewichteten Sichtbarkeit
  • Statistiken hinzufügen: +37% beim subjektiven Eindruck
  • Keyword-Stuffing: -10% (noch schlechter als nichts tun auf einer echten Suchmaschine)

Das bestätigt, dass die Strategien über das Labor hinaus generalisieren.


Praktische Tipps für Content-Ersteller

Wenn Sie Inhalte im Web erstellen — ob Sie einen Blog, eine Unternehmenswebsite oder einen E-Commerce-Shop betreiben — hier ist, was Sie tun sollten:

  1. Hören Sie mit Keyword-Stuffing auf. Es funktioniert nicht für die KI-Suche. LLMs verstehen Kontext, nicht Keyword-Dichte.
  2. Fügen Sie echte Daten hinzu. Ersetzen Sie "die Umsätze sind deutlich gestiegen" durch "die Umsätze sind um 47% im Jahresvergleich gestiegen (Quelle: Branchenbericht 2024)."
  3. Zitieren Sie Experten. Fügen Sie direkte Zitate von anerkannten Autoritäten in Ihrem Bereich ein.
  4. Zitieren Sie Ihre Quellen. Referenzieren und verlinken Sie auf glaubwürdige, autoritative Quellen.
  5. Schreiben Sie klar. Verbessern Sie den Fluss und die Lesbarkeit Ihres Inhalts.
  6. Passen Sie sich an Ihre Branche an. Wählen Sie die Strategien, die zu Ihrem Content-Typ passen.
  7. Kombinieren Sie Strategien. Verbinden Sie 2-3 Ansätze für maximale Wirkung.

Das Gesamtbild

Dieses Paper, veröffentlicht auf der KDD 2024 (einer der grössten Data-Science-Konferenzen), hat im Wesentlichen ein neues Fachgebiet geschaffen. Vor GEO hatten Content-Ersteller keinen Rahmen, um über Sichtbarkeit in der KI-Suche nachzudenken. Seit seiner Veröffentlichung ist das Feld explodiert — mit mehr als einem Dutzend Folge-Papers in 2025-2026, die agentische GEO-Systeme, E-Commerce-Anwendungen, multimodale Optimierung und mehr abdecken.

Die grundlegende Erkenntnis bleibt: Generative Suchmaschinen belohnen Inhaltsqualität, Glaubwürdigkeit und Klarheit gegenüber dem traditionellen SEO-Spielplan aus Backlinks und Keywords. Für Content-Ersteller, die bereit sind sich anzupassen, ist das sowohl eine Herausforderung als auch eine Chance.


GEO-bench: Der Benchmark

Das Paper veröffentlichte auch GEO-bench, einen Benchmark mit 10.000 vielfältigen Anfragen über 25 Domänen, 9 Anfragetypen und mehrere Schwierigkeitsgrade. Er umfasst:

  • Echte Nutzeranfragen von Bing (MS MARCO), Google (Natural Questions, ORCAS)
  • Anspruchsvolle akademische Fragen (All Souls College, Oxford)
  • Trend-Anfragen von Perplexity.ai
  • ELI5-Fragen (Explain Like I'm 5) von Reddit
  • GPT-4-generierte Anfragen für Diversität

Dieser Benchmark ist öffentlich verfügbar und hat sich zum Standard-Testfeld für GEO-Forschung entwickelt.


Paper: Aggarwal, P., Murahari, V., Rajpurohit, T., Kalyan, A., Narasimhan, K., & Deshpande, A. (2024). GEO: Generative Engine Optimization. Proceedings of KDD 2024. arXiv:2311.09735