GEO: Generative Engine Optimization — El artículo fundacional, simplificado
Basado en el artículo "GEO: Generative Engine Optimization" de Aggarwal, Murahari, Rajpurohit, Kalyan, Narasimhan y Deshpande (Princeton University / IIT Delhi). Publicado en KDD 2024.
Paper: arXiv:2311.09735 | Código: github.com/GEO-optim/GEO
El problema: la búsqueda IA está acabando con el tráfico web
Durante 25 años, cuando buscabas algo en Google, obtenías una lista de enlaces azules. Hacías clic en uno de ellos, visitabas un sitio, y el propietario del sitio recibía tráfico. Todo el mundo estaba contento.
Luego llegaron los motores de búsqueda generativos — herramientas como ChatGPT, Perplexity, Google AI Overviews y Bing Copilot. En lugar de darte enlaces, leen varios sitios web, sintetizan la información y te dan una respuesta directa. Obtienes lo que necesitas sin hacer clic en la fuente original.
Es genial para los usuarios. Pero es una catástrofe para los millones de sitios web, blogs, pequeñas empresas y creadores de contenido que dependen de ese tráfico para vivir.
Los investigadores detrás de este artículo identificaron tres partes interesadas en este nuevo mundo:
- Los usuarios — ganan (respuestas más rápidas y mejores)
- Los proveedores de motores generativos — ganan (más usuarios, más ingresos)
- Los creadores de contenido — pierden (menos tráfico, menos visibilidad)
El artículo plantea una pregunta simple: ¿Pueden los creadores de contenido hacer algo al respecto?
¿Qué es el GEO?
El Generative Engine Optimization (GEO) es el nuevo equivalente del SEO, pero para los motores de búsqueda alimentados por IA.
- SEO = optimizar tu contenido para que Google lo posicione más alto en su lista de enlaces
- GEO = optimizar tu contenido para que los motores de búsqueda IA lo citen y lo utilicen más visiblemente en sus respuestas generadas
La diferencia clave: en la búsqueda tradicional, la visibilidad significa "aparecer más arriba en una lista ordenada." En la búsqueda generativa, la visibilidad significa "qué proporción de la respuesta de la IA proviene de tu contenido y si recibes crédito por ello."
¿Cómo funcionan realmente los motores de búsqueda generativos?
El artículo formaliza lo que denominan un Generative Engine (GE). Este es el pipeline simplificado:
- Haces una pregunta (ej.: "¿Cuál es el secreto del chocolate suizo?")
- El motor reformula tu consulta en subconsultas más simples, más fáciles de buscar
- Un motor de búsqueda tradicional (como Google) recupera las páginas web más relevantes
- Un LLM resume cada fuente
- Otro LLM genera una respuesta final, tejiendo la información de múltiples fuentes con citas en línea
El resultado es una respuesta rica y estructurada — no una lista de enlaces. Tu sitio web puede ser una de las fuentes utilizadas, pero el usuario quizás nunca lo visite.
El gran desafío: ¿cómo medir la visibilidad?
En Google, la visibilidad es simple: ¿cuál es tu posición en la página de resultados? La posición 1 obtiene ~36% de los clics, la posición 10 casi nada.
En los motores generativos, es mucho más complejo. Tu contenido puede ser:
- Citado una vez al inicio de la respuesta (alta visibilidad)
- Citado cinco veces pero enterrado al final (visibilidad media)
- Utilizado para informar la respuesta pero nunca citado explícitamente (visibilidad cero)
Los investigadores propusieron tres formas de medir la visibilidad:
1. Recuento de palabras (Word Count)
¿Cuántas palabras en la respuesta de la IA se atribuyen a tu fuente, en relación con la respuesta total? Más palabras = más visibilidad.
2. Recuento de palabras ajustado por posición
Lo mismo, pero las palabras que aparecen más temprano en la respuesta cuentan más (porque la gente lee el principio con más atención). Esto utiliza una decadencia exponencial — ser citado primero vale mucho más que ser citado último.
3. Impresión subjetiva
Una puntuación multidimensional que cubre: la relevancia respecto a la consulta, la influencia en la respuesta, la unicidad de tu contribución, la probabilidad de que el usuario haga clic en tu cita, y la diversidad del material presentado.
Las 9 estrategias de optimización probadas
Los investigadores probaron 9 formas diferentes de modificar el contenido de un sitio web y midieron si cada una mejoraba la visibilidad en las respuestas de los motores generativos.
Lo que no funciona
| Estrategia | Qué hace | Resultado |
|---|---|---|
| Relleno de palabras clave | Añadir más palabras clave de la consulta en tu contenido | Peor que no hacer nada. El truco favorito del SEO tradicional es inútil aquí — los LLMs entienden el significado, no solo las palabras clave. |
| Palabras únicas | Añadir vocabulario raro/inusual | Ninguna mejora significativa. |
Lo que funciona
| Estrategia | Qué hace | Mejora |
|---|---|---|
| Añadir citas | Añadir citas relevantes de fuentes creíbles | +40% de visibilidad (mejor resultado) |
| Añadir estadísticas | Reemplazar afirmaciones vagas por cifras y datos precisos | +30% de visibilidad |
| Citar fuentes | Añadir referencias y citas hacia fuentes autoritarias | +27% de visibilidad |
| Optimización de la fluidez | Mejorar la legibilidad y el flujo de tu escritura | +25% de visibilidad |
| Términos técnicos | Usar terminología precisa y específica del dominio | +15% de visibilidad |
| Fácil de entender | Simplificar el lenguaje para una accesibilidad más amplia | +14% de visibilidad |
| Tono autoritario | Escribir con un estilo más persuasivo y seguro | +10% de visibilidad |
Las tres mejores estrategias tienen un punto en común: añaden señales de credibilidad. Las citas, estadísticas y referencias hacen el contenido más fiable — y los motores generativos recompensan eso.
El descubrimiento más sorprendente: el GEO ayuda a los pequeños
Cuando los investigadores probaron qué sucede cuando todos los sitios optimizan simultáneamente, encontraron algo notable:
- Los sitios en posición #5 en Google (los outsiders) vieron ganancias de visibilidad de hasta +115%
- Los sitios en posición #1 en Google (los grandes actores) vieron su visibilidad caer un 30%
¿Por qué? Los rankings tradicionales de Google dependen en gran medida de los backlinks, la autoridad del dominio y la notoriedad de la marca — cosas que favorecen a las grandes empresas. Pero los motores generativos se preocupan más por la calidad del contenido. Cuando un pequeño blog añade citas sólidas y estadísticas, la IA lo trata tan seriamente como el sitio de una empresa del IBEX 35.
Es potencialmente un gran igualador para los creadores independientes y las pequeñas empresas.
El dominio importa: una talla no sirve para todos
Las estrategias más efectivas dependen de tu tema:
| Estrategia | Funciona mejor para |
|---|---|
| Tono autoritario | Temas de debate, Historia, Ciencia |
| Optimización de la fluidez | Negocios, Ciencia, Salud |
| Citar fuentes | Afirmaciones factuales, Derecho y Gobierno |
| Añadir citas | Sociedad, Explicaciones, Historia |
| Añadir estadísticas | Derecho y Gobierno, Debate, Artículos de opinión |
Un blog jurídico debería centrarse en añadir estadísticas y citas. Un sitio de historia debería añadir citas directas. Un sitio de salud debería mejorar la fluidez. No existe una "mejor" estrategia universal.
Combinar estrategias funciona aún mejor
Los investigadores también probaron pares de estrategias juntas. La combinación ganadora:
Optimización de la fluidez + Añadir estadísticas = +35,8% de visibilidad
Esto supera cualquier estrategia individual en más de 5 puntos porcentuales. La lección: no elijas un solo enfoque — superpón varios.
Añadir referencias en combinación con otros métodos fue también particularmente potente. Aunque "Citar fuentes" por sí solo no era el mejor, potenciaba sistemáticamente los resultados en combinación con otras estrategias (media de +31,4% en combinación).
Validación en condiciones reales: también funciona en Perplexity.ai
Los investigadores no solo probaron en su propio motor simulado. También realizaron experimentos en Perplexity.ai, un motor de búsqueda generativo real con millones de usuarios.
Los resultados se mantienen:
- Añadir citas: +22% en visibilidad ajustada por posición
- Añadir estadísticas: +37% en impresión subjetiva
- Relleno de palabras clave: -10% (aún peor que no hacer nada en un motor real)
Esto confirma que las estrategias se generalizan más allá del laboratorio.
Consejos prácticos para los creadores de contenido
Si creas contenido en la web — ya sea que gestiones un blog, un sitio empresarial o una tienda e-commerce — esto es lo que debes hacer:
- Deja de rellenar con palabras clave. No funciona para la búsqueda IA. Los LLMs entienden el contexto, no la densidad de palabras clave.
- Añade datos reales. Sustituye "las ventas aumentaron significativamente" por "las ventas aumentaron un 47% interanual (Fuente: Informe Sectorial 2024)."
- Cita a expertos. Incluye citas directas de autoridades reconocidas en tu dominio.
- Cita tus fuentes. Referencia y enlaza hacia fuentes creíbles y autoritarias.
- Escribe con claridad. Mejora el flujo y la legibilidad de tu contenido.
- Adapta a tu dominio. Elige las estrategias que correspondan a tu tipo de contenido.
- Superpón estrategias. Combina 2-3 enfoques para un impacto máximo.
La visión de conjunto
Este artículo, publicado en KDD 2024 (una de las mayores conferencias de data science), esencialmente creó un nuevo campo. Antes del GEO, los creadores de contenido no tenían ningún marco para pensar sobre la visibilidad en la búsqueda IA. Desde su publicación, el campo ha explotado — con más de una docena de artículos de seguimiento en 2025-2026 que cubren sistemas GEO agénticos, aplicaciones e-commerce, optimización multimodal, y mucho más.
El insight fundamental permanece: los motores generativos recompensan la calidad del contenido, la credibilidad y la claridad por encima del playbook SEO tradicional de backlinks y palabras clave. Para los creadores de contenido dispuestos a adaptarse, esto es tanto un desafío como una oportunidad.
GEO-bench: el benchmark
El artículo también publicó GEO-bench, un benchmark de 10 000 consultas diversas que cubren 25 dominios, 9 tipos de consultas y varios niveles de dificultad. Incluye:
- Consultas reales de usuarios de Bing (MS MARCO), Google (Natural Questions, ORCAS)
- Preguntas académicas exigentes (All Souls College, Oxford)
- Consultas en tendencia de Perplexity.ai
- Preguntas ELI5 (Explain Like I'm 5) de Reddit
- Consultas generadas por GPT-4 para la diversidad
Este benchmark está disponible públicamente y se ha convertido en el banco de pruebas estándar para la investigación en GEO.
Paper: Aggarwal, P., Murahari, V., Rajpurohit, T., Kalyan, A., Narasimhan, K., & Deshpande, A. (2024). GEO: Generative Engine Optimization. Proceedings of KDD 2024. arXiv:2311.09735