SAGEO Arena: El benchmark que enfrenta al GEO con la realidad

Basado en el artículo "SAGEO Arena: A Realistic Environment for Evaluating Search-Augmented Generative Engine Optimization" de Kim, Jeong, Kim, Lee y Lee (Yonsei University / Konkuk University). Publicado en febrero de 2026.

Paper: arXiv:2602.12187


El problema: el GEO vive en un mundo simplificado

Desde el artículo fundacional del GEO en 2024, los investigadores han propuesto numerosas estrategias para mejorar la visibilidad del contenido en las respuestas de los motores de búsqueda IA. Añadir estadísticas, citas, mejorar la fluidez — todo funciona. En el laboratorio.

Pero hay un problema fundamental: todos los benchmarks existentes hacen trampa.

¿Cómo? Se saltan las etapas más difíciles. Cuando Perplexity o Google AI Overviews responden a una pregunta, esto es lo que realmente ocurre:

  1. Retrieval (recuperación) — el motor busca entre miles de millones de páginas y selecciona unos cientos
  2. Reranking (reclasificación) — un modelo reclasifica estas páginas para quedarse con las 5-10 mejores
  3. Generation (generación) — un LLM sintetiza una respuesta a partir de estas páginas seleccionadas

Los benchmarks existentes (GEO-Bench, AutoGEO, etc.) solo prueban la etapa 3. Entregan directamente los documentos al LLM y miden si la optimización mejora la citación. Ignoran completamente las etapas 1 y 2.

Es como evaluar a un velocista únicamente en los últimos 10 metros de una carrera de 100m. No dice nada sobre su capacidad para correr la carrera completa.


Lo que SAGEO Arena cambia

SAGEO Arena es el primer benchmark que prueba el pipeline de extremo a extremo: retrieval -> reranking -> generation. Además introduce un concepto clave que todos ignoraban: la información estructural.

Un verdadero corpus web a gran escala

A diferencia de los benchmarks anteriores que utilizan texto bruto, SAGEO Arena construyó un corpus de 170 000 documentos web reales que cubren 9 dominios. Para cada documento, extrajeron:

  • El texto del cuerpo (body text) — el contenido principal
  • Las informaciones estructurales — título, meta description, jerarquía de títulos (h1, h2...) y schema markup

¿Por qué es importante? Porque en el mundo real, los motores de búsqueda utilizan masivamente estas señales estructurales para decidir qué documentos recuperar y clasificar. Ignorarlas es ignorar la mitad del juego.

Un pipeline completo y modular

SAGEO Arena integra las tres etapas del pipeline de búsqueda generativa:

Etapa Qué ocurre Qué se evalúa
Retrieval El motor busca en el corpus de 170K documentos ¿El documento optimizado sigue siendo recuperado?
Reranking Un modelo reclasifica los resultados ¿El documento sube o baja en la clasificación?
Generation Un LLM genera la respuesta final ¿El documento es citado en la respuesta?

Cada etapa es modular y configurable. Los investigadores pueden rastrear exactamente cómo una optimización afecta a cada etapa del pipeline.

El protocolo de evaluación

El proceso es simple pero riguroso:

  1. Ejecutar el pipeline con una consulta de prueba
  2. Seleccionar un documento objetivo entre los que alcanzan la generación
  3. Aplicar una estrategia de optimización GEO sobre ese documento
  4. Reinyectar el documento optimizado en el corpus
  5. Relanzar el pipeline con la misma consulta
  6. Medir: ¿el documento ha ganado, mantenido o perdido su visibilidad en cada etapa?

El descubrimiento impactante: el GEO rompe el retrieval

Es el resultado más importante del artículo, y cuestiona todo el campo:

Las estrategias GEO existentes a veces mejoran la generación, pero degradan activamente el retrieval y el reranking.

En concreto: cuando optimizas el texto de tu página con las técnicas GEO clásicas (añadir estadísticas, citas, etc.), tu página puede desaparecer de los resultados de búsqueda antes incluso de llegar al LLM. El documento optimizado ya no es recuperado por el motor de búsqueda, por lo que no tiene ninguna posibilidad de ser citado.

Es como si mejoraras el escaparate de tu tienda, pero el GPS dejara de dirigir a los clientes hacia tu calle.

¿Por qué ocurre?

Las estrategias GEO modifican el texto del cuerpo para agradar al LLM (etapa 3), pero estas modificaciones pueden:

  • Alterar las señales que el motor de retrieval utiliza para encontrar el documento (etapa 1)
  • Cambiar la relevancia percibida por el modelo de reranking (etapa 2)

Optimizar para una etapa puede sabotear las otras. Es un problema que nadie había medido antes de SAGEO Arena.


La información estructural: el héroe inesperado

El segundo gran descubrimiento: la información estructural (títulos, meta descriptions, schema markup) es esencial para mantener la visibilidad en el retrieval.

Los investigadores encontraron que los dos tipos de información juegan roles complementarios:

Tipo de información Rol principal
Información estructural (título, meta, schema) Determina si el documento es encontrado (retrieval)
Texto del cuerpo (body text) Determina si el documento es bien clasificado (reranking) y citado (generation)

Dicho de otro modo: la estructura hace entrar tu documento en la carrera, y el contenido determina si gana. Optimizar únicamente el contenido sin tocar la estructura es como tener un producto excelente sin ningún marketing.

Es un puente directo entre el SEO tradicional (que se centra en la estructura) y el GEO (que se centra en el contenido). Ambos son necesarios.


SAGEO: la optimización por etapa

A partir de estos descubrimientos, los investigadores proponen stage-aware SAGEO — un enfoque que adapta la optimización a cada etapa del pipeline:

  • Para el retrieval -> optimizar las informaciones estructurales (títulos, meta descriptions, schema markup)
  • Para el reranking -> optimizar la relevancia y la calidad del texto
  • Para la generation -> aplicar las técnicas GEO clásicas (estadísticas, citas, fluidez)

Este enfoque combinado obtiene la mejor visibilidad global entre todas las estrategias evaluadas. Es la primera vez que un método optimiza conjuntamente SEO y GEO.


Comparación con los benchmarks existentes

Benchmark Corpus Retrieval Reranking Generation Info estructural
GEO-Bench (2024) No No No
AutoGEO (2025) No No No
C-SEO Bench (2025) No No No
SAGEO Arena (2026) 170K docs

La diferencia es llamativa: SAGEO Arena es el único que cubre el pipeline completo con documentos web reales.


Lo que significa para los creadores de contenido

1. El SEO no ha muerto

Contrariamente a lo que muchos afirman, el SEO tradicional sigue siendo crucial. Las informaciones estructurales (títulos, meta descriptions, schema markup) son lo que permite que tu contenido sea encontrado por los motores de búsqueda IA en primer lugar. Sin eso, tus optimizaciones GEO no sirven de nada.

2. No sacrifiques el retrieval por la generation

Si reescribes tu contenido para agradar a los LLMs, verifica que tu página siga bien indexada y recuperada por los motores de búsqueda. Un contenido perfectamente optimizado para la generación pero invisible para el retrieval tiene una visibilidad de cero.

3. Piensa en pipeline, no en silo

La optimización eficaz requiere trabajar en las tres etapas:

  • Estructura -> para ser encontrado
  • Relevancia -> para ser bien clasificado
  • Calidad del contenido -> para ser citado

4. El schema markup importa

Los datos estructurados (JSON-LD, schema.org) no son solo un bonus SEO. Juegan un papel activo en la forma en que los motores de búsqueda IA comprenden y seleccionan tu contenido.


Las limitaciones a tener en cuenta

  • El benchmark utiliza modelos open source para simular el pipeline, no los verdaderos motores comerciales (Google, Perplexity, etc.)
  • El corpus de 170K documentos es grande pero sigue siendo más pequeño que la web real
  • Los factores off-page (backlinks, autoridad del dominio) no están modelados

A pesar de estas limitaciones, SAGEO Arena representa un salto cualitativo importante respecto a los benchmarks anteriores.


La visión de conjunto

SAGEO Arena es un artículo que debería hacer reflexionar a toda la comunidad GEO. Su mensaje central es simple pero potente:

Optimizar únicamente para la última etapa del pipeline es insuficiente — y potencialmente contraproducente.

El futuro de la optimización para la búsqueda IA no es el SEO solo, ni el GEO solo, sino un enfoque integrado que comprende y optimiza cada etapa del pipeline de búsqueda generativa. SAGEO Arena proporciona por fin la herramienta para medir esto.

Para los creadores de contenido, la lección es clara: mantén tus fundamentos SEO sólidos (estructura, metadata, schema) mientras aplicas las técnicas GEO (estadísticas, citas, fluidez) a tu contenido. Lo uno sin lo otro no basta.


Paper: Kim, S., Jeong, W., Kim, S., Lee, S., & Lee, D. (2026). SAGEO Arena: A Realistic Environment for Evaluating Search-Augmented Generative Engine Optimization. arXiv:2602.12187