SAGEO Arena: Der Benchmark, der GEO mit der Realität konfrontiert

Basierend auf dem Paper "SAGEO Arena: A Realistic Environment for Evaluating Search-Augmented Generative Engine Optimization" von Kim, Jeong, Kim, Lee & Lee (Yonsei University / Konkuk University). Veröffentlicht im Februar 2026.

Paper: arXiv:2602.12187


Das Problem: GEO lebt in einer vereinfachten Welt

Seit dem GEO-Grundlagenpapier von 2024 haben Forscher zahlreiche Strategien vorgeschlagen, um die Sichtbarkeit von Inhalten in den Antworten von KI-Suchmaschinen zu verbessern. Statistiken hinzufügen, Zitate einfügen, die Lesbarkeit verbessern — all das funktioniert. Im Labor.

Aber es gibt ein grundlegendes Problem: Alle bestehenden Benchmarks schummeln.

Wie? Sie überspringen die schwierigsten Schritte. Wenn Perplexity oder Google AI Overviews eine Frage beantworten, passiert in Wirklichkeit Folgendes:

  1. Retrieval (Abruf) — die Suchmaschine durchsucht Milliarden von Seiten und wählt einige Hundert aus
  2. Reranking (Neusortierung) — ein Modell sortiert diese Seiten neu und behält die 5-10 besten
  3. Generation (Generierung) — ein LLM synthetisiert eine Antwort aus diesen ausgewählten Seiten

Die bestehenden Benchmarks (GEO-Bench, AutoGEO usw.) testen nur Schritt 3. Sie geben die Dokumente direkt an das LLM und messen, ob die Optimierung die Zitierung verbessert. Sie ignorieren die Schritte 1 und 2 komplett.

Das ist, als würde man einen Sprinter nur auf den letzten 10 Metern eines 100-Meter-Laufs testen. Das sagt nichts über seine Fähigkeit, das gesamte Rennen zu laufen.


Was SAGEO Arena verändert

SAGEO Arena ist der erste Benchmark, der die gesamte Pipeline End-to-End testet: Retrieval → Reranking → Generation. Er führt auch ein Schlüsselkonzept ein, das alle bisher ignorierten: strukturelle Informationen.

Ein echtes Web-Korpus im grossen Massstab

Anders als frühere Benchmarks, die Rohtext verwenden, hat SAGEO Arena ein Korpus von 170.000 echten Webdokumenten aus 9 Domänen aufgebaut. Für jedes Dokument wurden extrahiert:

  • Der Fliesstext (Body Text) — der Hauptinhalt
  • Die strukturellen Informationen — Titel, Meta-Beschreibung, Überschriftenhierarchie (h1, h2...) und Schema-Markup

Warum ist das wichtig? Weil in der realen Welt Suchmaschinen diese strukturellen Signale massiv nutzen, um zu entscheiden, welche Dokumente abgerufen und eingestuft werden. Sie zu ignorieren bedeutet, die Hälfte des Spiels zu ignorieren.

Eine vollständige und modulare Pipeline

SAGEO Arena integriert die drei Stufen der generativen Such-Pipeline:

Stufe Was passiert Was wird bewertet
Retrieval Die Suchmaschine durchsucht das Korpus von 170.000 Dokumenten Wird das optimierte Dokument noch abgerufen?
Reranking Ein Modell sortiert die Ergebnisse neu Steigt oder fällt das Dokument im Ranking?
Generation Ein LLM generiert die finale Antwort Wird das Dokument in der Antwort zitiert?

Jede Stufe ist modular und konfigurierbar. Die Forscher können genau nachverfolgen, wie eine Optimierung jede Stufe der Pipeline beeinflusst.

Das Evaluierungsprotokoll

Der Prozess ist einfach, aber rigoros:

  1. Die Pipeline mit einer Testanfrage ausführen
  2. Ein Zieldokument aus denen auswählen, die die Generierungsstufe erreichen
  3. Eine GEO-Optimierungsstrategie auf dieses Dokument anwenden
  4. Das optimierte Dokument zurück in das Korpus einfügen
  5. Die Pipeline mit derselben Anfrage erneut ausführen
  6. Messen: Hat das Dokument seine Sichtbarkeit in jeder Stufe gewonnen, gehalten oder verloren?

Die schockierende Entdeckung: GEO beschädigt das Retrieval

Das ist das wichtigste Ergebnis des Papers, und es stellt das gesamte Feld in Frage:

Bestehende GEO-Strategien verbessern manchmal die Generierung, verschlechtern aber aktiv das Retrieval und Reranking.

Konkret: Wenn Sie den Text Ihrer Seite mit klassischen GEO-Techniken optimieren (Statistiken hinzufügen, Zitate einfügen usw.), kann Ihre Seite aus den Suchergebnissen verschwinden, bevor sie überhaupt das LLM erreicht. Das optimierte Dokument wird von der Suchmaschine nicht mehr abgerufen und hat daher keine Chance, zitiert zu werden.

Das ist, als würden Sie das Schaufenster Ihres Geschäfts verbessern, aber das Navi die Kunden nicht mehr in Ihre Strasse leiten.

Warum passiert das?

GEO-Strategien modifizieren den Fliesstext, um dem LLM zu gefallen (Schritt 3), aber diese Änderungen können:

  • Die Signale verändern, die die Retrieval-Suchmaschine nutzt, um das Dokument zu finden (Schritt 1)
  • Die vom Reranking-Modell wahrgenommene Relevanz verändern (Schritt 2)

Für eine Stufe zu optimieren kann die anderen sabotieren. Das ist ein Problem, das vor SAGEO Arena niemand gemessen hatte.


Strukturelle Informationen: Der unerwartete Held

Die zweite grosse Entdeckung: Strukturelle Informationen (Titel, Meta-Beschreibungen, Schema-Markup) sind entscheidend für die Aufrechterhaltung der Sichtbarkeit beim Retrieval.

Die Forscher fanden heraus, dass die beiden Informationstypen komplementäre Rollen spielen:

Informationstyp Hauptrolle
Strukturelle Informationen (Titel, Meta, Schema) Bestimmt, ob das Dokument gefunden wird (Retrieval)
Fliesstext (Body Text) Bestimmt, ob das Dokument gut eingestuft (Reranking) und zitiert wird (Generation)

Anders gesagt: Die Struktur bringt Ihr Dokument ins Rennen, und der Inhalt bestimmt, ob es gewinnt. Nur den Inhalt zu optimieren, ohne die Struktur anzupassen, ist wie ein ausgezeichnetes Produkt ohne jegliches Marketing zu haben.

Das ist eine direkte Brücke zwischen traditionellem SEO (das sich auf die Struktur konzentriert) und GEO (das sich auf den Inhalt konzentriert). Beides ist notwendig.


SAGEO: Stufenspezifische Optimierung

Auf Basis dieser Entdeckungen schlagen die Forscher stage-aware SAGEO vor — einen Ansatz, der die Optimierung an jede Stufe der Pipeline anpasst:

  • Für das Retrieval → strukturelle Informationen optimieren (Titel, Meta-Beschreibungen, Schema-Markup)
  • Für das Reranking → Relevanz und Qualität des Textes optimieren
  • Für die Generation → klassische GEO-Techniken anwenden (Statistiken, Zitate, Lesbarkeit)

Dieser kombinierte Ansatz erzielt die beste Gesamtsichtbarkeit unter allen evaluierten Strategien. Es ist das erste Mal, dass eine Methode SEO und GEO gemeinsam optimiert.


Vergleich mit bestehenden Benchmarks

Benchmark Korpus Retrieval Reranking Generation Strukturelle Info
GEO-Bench (2024) Ja
AutoGEO (2025) Ja
C-SEO Bench (2025) Ja
SAGEO Arena (2026) 170.000 Docs Ja Ja Ja Ja

Der Unterschied ist frappierend: SAGEO Arena ist der einzige, der die vollständige Pipeline mit echten Webdokumenten abdeckt.


Was das für Content-Ersteller bedeutet

1. SEO ist nicht tot

Entgegen vielen Behauptungen bleibt traditionelles SEO entscheidend. Strukturelle Informationen (Titel, Meta-Beschreibungen, Schema-Markup) sind es, die es Ihrem Inhalt ermöglichen, von KI-Suchmaschinen überhaupt gefunden zu werden. Ohne das sind Ihre GEO-Optimierungen nutzlos.

2. Opfern Sie das Retrieval nicht für die Generation

Wenn Sie Ihren Inhalt umschreiben, um LLMs zu gefallen, stellen Sie sicher, dass Ihre Seite weiterhin gut indexiert und von Suchmaschinen abgerufen wird. Ein für die Generierung perfekt optimierter Inhalt, der beim Retrieval unsichtbar ist, hat eine Sichtbarkeit von null.

3. Denken Sie in Pipelines, nicht in Silos

Effektive Optimierung erfordert Arbeit an allen drei Stufen:

  • Struktur → um gefunden zu werden
  • Relevanz → um gut eingestuft zu werden
  • Inhaltsqualität → um zitiert zu werden

4. Schema-Markup zählt

Strukturierte Daten (JSON-LD, schema.org) sind nicht nur ein SEO-Bonus. Sie spielen eine aktive Rolle dabei, wie KI-Suchmaschinen Ihren Inhalt verstehen und auswählen.


Zu beachtende Einschränkungen

  • Der Benchmark verwendet Open-Source-Modelle zur Simulation der Pipeline, nicht die echten kommerziellen Suchmaschinen (Google, Perplexity usw.)
  • Das Korpus von 170.000 Dokumenten ist gross, aber immer noch kleiner als das echte Web
  • Off-Page-Faktoren (Backlinks, Domain-Autorität) werden nicht modelliert

Trotz dieser Einschränkungen stellt SAGEO Arena einen erheblichen qualitativen Sprung gegenüber früheren Benchmarks dar.


Das Gesamtbild

SAGEO Arena ist ein Paper, das die gesamte GEO-Community zum Nachdenken bringen sollte. Seine zentrale Botschaft ist einfach, aber kraftvoll:

Nur für die letzte Stufe der Pipeline zu optimieren ist unzureichend — und potenziell kontraproduktiv.

Die Zukunft der Optimierung für die KI-Suche liegt weder in SEO allein noch in GEO allein, sondern in einem integrierten Ansatz, der jede Stufe der generativen Such-Pipeline versteht und optimiert. SAGEO Arena liefert endlich das Werkzeug, um das zu messen.

Für Content-Ersteller ist die Lektion klar: Halten Sie Ihre SEO-Grundlagen solide (Struktur, Metadaten, Schema) und wenden Sie gleichzeitig GEO-Techniken (Statistiken, Zitate, Lesbarkeit) auf Ihren Inhalt an. Das eine ohne das andere reicht nicht aus.


Paper: Kim, S., Jeong, W., Kim, S., Lee, S., & Lee, D. (2026). SAGEO Arena: A Realistic Environment for Evaluating Search-Augmented Generative Engine Optimization. arXiv:2602.12187