GEO: Generative Engine Optimization — El artículo fundacional, simplificado

Basado en el artículo "GEO: Generative Engine Optimization" de Aggarwal, Murahari, Rajpurohit, Kalyan, Narasimhan y Deshpande (Princeton University / IIT Delhi). Publicado en KDD 2024.

Paper: arXiv:2311.09735 | Código: github.com/GEO-optim/GEO

El problema: la búsqueda IA está acabando con el tráfico web

Durante 25 años, cuando buscabas algo en Google, obtenías una lista de enlaces azules. Hacías clic en uno de ellos, visitabas un sitio, y el propietario del sitio recibía tráfico. Todo el mundo estaba contento.

Luego llegaron los motores de búsqueda generativos — herramientas como ChatGPT, Perplexity, Google AI Overviews y Bing Copilot. En lugar de darte enlaces, leen varios sitios web, sintetizan la información y te dan una respuesta directa. Obtienes lo que necesitas sin hacer clic en la fuente original.

Es genial para los usuarios. Pero es una catástrofe para los millones de sitios web, blogs, pequeñas empresas y creadores de contenido que dependen de ese tráfico para vivir.

Los investigadores detrás de este artículo identificaron tres partes interesadas en este nuevo mundo:

Los usuarios — ganan (respuestas más rápidas y mejores)
Los proveedores de motores generativos — ganan (más usuarios, más ingresos)
Los creadores de contenido — pierden (menos tráfico, menos visibilidad)

El artículo plantea una pregunta simple: ¿Pueden los creadores de contenido hacer algo al respecto?

¿Qué es el GEO?

El Generative Engine Optimization (GEO) es el nuevo equivalente del SEO, pero para los motores de búsqueda alimentados por IA.

SEO = optimizar tu contenido para que Google lo posicione más alto en su lista de enlaces
GEO = optimizar tu contenido para que los motores de búsqueda IA lo citen y lo utilicen más visiblemente en sus respuestas generadas

La diferencia clave: en la búsqueda tradicional, la visibilidad significa "aparecer más arriba en una lista ordenada." En la búsqueda generativa, la visibilidad significa "qué proporción de la respuesta de la IA proviene de tu contenido y si recibes crédito por ello."

¿Cómo funcionan realmente los motores de búsqueda generativos?

El artículo formaliza lo que denominan un Generative Engine (GE). Este es el pipeline simplificado:

Haces una pregunta (ej.: "¿Cuál es el secreto del chocolate suizo?")
El motor reformula tu consulta en subconsultas más simples, más fáciles de buscar
Un motor de búsqueda tradicional (como Google) recupera las páginas web más relevantes
Un LLM resume cada fuente
Otro LLM genera una respuesta final, tejiendo la información de múltiples fuentes con citas en línea

El resultado es una respuesta rica y estructurada — no una lista de enlaces. Tu sitio web puede ser una de las fuentes utilizadas, pero el usuario quizás nunca lo visite.

El gran desafío: ¿cómo medir la visibilidad?

En Google, la visibilidad es simple: ¿cuál es tu posición en la página de resultados? La posición 1 obtiene ~36% de los clics, la posición 10 casi nada.

En los motores generativos, es mucho más complejo. Tu contenido puede ser:

Citado una vez al inicio de la respuesta (alta visibilidad)
Citado cinco veces pero enterrado al final (visibilidad media)
Utilizado para informar la respuesta pero nunca citado explícitamente (visibilidad cero)

Los investigadores propusieron tres formas de medir la visibilidad:

1. Recuento de palabras (Word Count)

¿Cuántas palabras en la respuesta de la IA se atribuyen a tu fuente, en relación con la respuesta total? Más palabras = más visibilidad.

2. Recuento de palabras ajustado por posición

Lo mismo, pero las palabras que aparecen más temprano en la respuesta cuentan más (porque la gente lee el principio con más atención). Esto utiliza una decadencia exponencial — ser citado primero vale mucho más que ser citado último.

3. Impresión subjetiva

Una puntuación multidimensional que cubre: la relevancia respecto a la consulta, la influencia en la respuesta, la unicidad de tu contribución, la probabilidad de que el usuario haga clic en tu cita, y la diversidad del material presentado.

Las 9 estrategias de optimización probadas

Los investigadores probaron 9 formas diferentes de modificar el contenido de un sitio web y midieron si cada una mejoraba la visibilidad en las respuestas de los motores generativos.

Lo que no funciona

Estrategia	Qué hace	Resultado
Relleno de palabras clave	Añadir más palabras clave de la consulta en tu contenido	Peor que no hacer nada. El truco favorito del SEO tradicional es inútil aquí — los LLMs entienden el significado, no solo las palabras clave.
Palabras únicas	Añadir vocabulario raro/inusual	Ninguna mejora significativa.

Lo que funciona

Estrategia	Qué hace	Mejora
Añadir citas	Añadir citas relevantes de fuentes creíbles	+40% de visibilidad (mejor resultado)
Añadir estadísticas	Reemplazar afirmaciones vagas por cifras y datos precisos	+30% de visibilidad
Citar fuentes	Añadir referencias y citas hacia fuentes autoritarias	+27% de visibilidad
Optimización de la fluidez	Mejorar la legibilidad y el flujo de tu escritura	+25% de visibilidad
Términos técnicos	Usar terminología precisa y específica del dominio	+15% de visibilidad
Fácil de entender	Simplificar el lenguaje para una accesibilidad más amplia	+14% de visibilidad
Tono autoritario	Escribir con un estilo más persuasivo y seguro	+10% de visibilidad

Las tres mejores estrategias tienen un punto en común: añaden señales de credibilidad. Las citas, estadísticas y referencias hacen el contenido más fiable — y los motores generativos recompensan eso.

El descubrimiento más sorprendente: el GEO ayuda a los pequeños

Cuando los investigadores probaron qué sucede cuando todos los sitios optimizan simultáneamente, encontraron algo notable:

Los sitios en posición #5 en Google (los outsiders) vieron ganancias de visibilidad de hasta +115%
Los sitios en posición #1 en Google (los grandes actores) vieron su visibilidad caer un 30%

¿Por qué? Los rankings tradicionales de Google dependen en gran medida de los backlinks, la autoridad del dominio y la notoriedad de la marca — cosas que favorecen a las grandes empresas. Pero los motores generativos se preocupan más por la calidad del contenido. Cuando un pequeño blog añade citas sólidas y estadísticas, la IA lo trata tan seriamente como el sitio de una empresa del IBEX 35.

Es potencialmente un gran igualador para los creadores independientes y las pequeñas empresas.

El dominio importa: una talla no sirve para todos

Las estrategias más efectivas dependen de tu tema:

Estrategia	Funciona mejor para
Tono autoritario	Temas de debate, Historia, Ciencia
Optimización de la fluidez	Negocios, Ciencia, Salud
Citar fuentes	Afirmaciones factuales, Derecho y Gobierno
Añadir citas	Sociedad, Explicaciones, Historia
Añadir estadísticas	Derecho y Gobierno, Debate, Artículos de opinión

Un blog jurídico debería centrarse en añadir estadísticas y citas. Un sitio de historia debería añadir citas directas. Un sitio de salud debería mejorar la fluidez. No existe una "mejor" estrategia universal.

Combinar estrategias funciona aún mejor

Los investigadores también probaron pares de estrategias juntas. La combinación ganadora:

Optimización de la fluidez + Añadir estadísticas = +35,8% de visibilidad

Esto supera cualquier estrategia individual en más de 5 puntos porcentuales. La lección: no elijas un solo enfoque — superpón varios.

Añadir referencias en combinación con otros métodos fue también particularmente potente. Aunque "Citar fuentes" por sí solo no era el mejor, potenciaba sistemáticamente los resultados en combinación con otras estrategias (media de +31,4% en combinación).

Validación en condiciones reales: también funciona en Perplexity.ai

Los investigadores no solo probaron en su propio motor simulado. También realizaron experimentos en Perplexity.ai, un motor de búsqueda generativo real con millones de usuarios.

Los resultados se mantienen:

Añadir citas: +22% en visibilidad ajustada por posición
Añadir estadísticas: +37% en impresión subjetiva
Relleno de palabras clave: -10% (aún peor que no hacer nada en un motor real)

Esto confirma que las estrategias se generalizan más allá del laboratorio.

Consejos prácticos para los creadores de contenido

Si creas contenido en la web — ya sea que gestiones un blog, un sitio empresarial o una tienda e-commerce — esto es lo que debes hacer:

Deja de rellenar con palabras clave. No funciona para la búsqueda IA. Los LLMs entienden el contexto, no la densidad de palabras clave.
Añade datos reales. Sustituye "las ventas aumentaron significativamente" por "las ventas aumentaron un 47% interanual (Fuente: Informe Sectorial 2024)."
Cita a expertos. Incluye citas directas de autoridades reconocidas en tu dominio.
Cita tus fuentes. Referencia y enlaza hacia fuentes creíbles y autoritarias.
Escribe con claridad. Mejora el flujo y la legibilidad de tu contenido.
Adapta a tu dominio. Elige las estrategias que correspondan a tu tipo de contenido.
Superpón estrategias. Combina 2-3 enfoques para un impacto máximo.

La visión de conjunto

Este artículo, publicado en KDD 2024 (una de las mayores conferencias de data science), esencialmente creó un nuevo campo. Antes del GEO, los creadores de contenido no tenían ningún marco para pensar sobre la visibilidad en la búsqueda IA. Desde su publicación, el campo ha explotado — con más de una docena de artículos de seguimiento en 2025-2026 que cubren sistemas GEO agénticos, aplicaciones e-commerce, optimización multimodal, y mucho más.

El insight fundamental permanece: los motores generativos recompensan la calidad del contenido, la credibilidad y la claridad por encima del playbook SEO tradicional de backlinks y palabras clave. Para los creadores de contenido dispuestos a adaptarse, esto es tanto un desafío como una oportunidad.

GEO-bench: el benchmark

El artículo también publicó GEO-bench, un benchmark de 10 000 consultas diversas que cubren 25 dominios, 9 tipos de consultas y varios niveles de dificultad. Incluye:

Consultas reales de usuarios de Bing (MS MARCO), Google (Natural Questions, ORCAS)
Preguntas académicas exigentes (All Souls College, Oxford)
Consultas en tendencia de Perplexity.ai
Preguntas ELI5 (Explain Like I'm 5) de Reddit
Consultas generadas por GPT-4 para la diversidad

Este benchmark está disponible públicamente y se ha convertido en el banco de pruebas estándar para la investigación en GEO.

Paper: Aggarwal, P., Murahari, V., Rajpurohit, T., Kalyan, A., Narasimhan, K., & Deshpande, A. (2024). GEO: Generative Engine Optimization. Proceedings of KDD 2024. arXiv:2311.09735

GEO: El artículo fundacional, simplificado