GEO: Generative Engine Optimization — Il paper fondatore, semplificato

Basato sul paper "GEO: Generative Engine Optimization" di Aggarwal, Murahari, Rajpurohit, Kalyan, Narasimhan & Deshpande (Princeton University / IIT Delhi). Pubblicato a KDD 2024.

Paper: arXiv:2311.09735 | Codice: github.com/GEO-optim/GEO

Il problema: la ricerca IA uccide il traffico web

Per 25 anni, quando cercavi qualcosa su Google, ottenevi una lista di link blu. Cliccavi su uno di essi, visitavi un sito, e il proprietario del sito riceveva traffico. Tutti contenti.

Poi sono arrivati i motori di ricerca generativi — strumenti come ChatGPT, Perplexity, Google AI Overviews e Bing Copilot. Invece di darti dei link, leggono diversi siti web, sintetizzano le informazioni e ti danno una risposta diretta. Ottieni ciò di cui hai bisogno senza mai cliccare sulla fonte originale.

È fantastico per gli utenti. Ma è una catastrofe per i milioni di siti web, blog, piccole imprese e creatori di contenuti che dipendono da quel traffico per vivere.

I ricercatori dietro a questo paper hanno identificato tre parti interessate in questo nuovo mondo:

Gli utenti — ci guadagnano (risposte più rapide e migliori)
I fornitori di motori generativi — ci guadagnano (più utenti, più ricavi)
I creatori di contenuti — ci perdono (meno traffico, meno visibilità)

Il paper pone una domanda semplice: I creatori di contenuti possono fare qualcosa?

Cos'è il GEO?

Il Generative Engine Optimization (GEO) è il nuovo equivalente del SEO, ma per i motori di ricerca alimentati dall'IA.

SEO = ottimizzare i tuoi contenuti affinché Google li posizioni più in alto nella sua lista di link
GEO = ottimizzare i tuoi contenuti affinché i motori di ricerca IA li citino e li utilizzino in modo più visibile nelle loro risposte generate

La differenza chiave: nella ricerca tradizionale, la visibilità significa "apparire più in alto in una lista ordinata." Nella ricerca generativa, la visibilità significa "quale parte della risposta dell'IA proviene dai tuoi contenuti e vieni accreditato."

Come funzionano realmente i motori di ricerca generativi?

Il paper formalizza ciò che chiamano un Generative Engine (GE). Ecco il pipeline semplificato:

Fai una domanda (es.: "Qual è il segreto del cioccolato svizzero?")
Il motore riformula la tua query in sotto-query più semplici, più facili da cercare
Un motore di ricerca tradizionale (come Google) recupera le pagine web più pertinenti
Un LLM riassume ogni fonte
Un altro LLM genera una risposta finale, intrecciando le informazioni di più fonti con citazioni inline

Il risultato è una risposta ricca e strutturata — non una lista di link. Il tuo sito web è forse una delle fonti utilizzate, ma l'utente potrebbe non visitarlo mai.

La grande sfida: come misurare la visibilità?

Su Google, la visibilità è semplice: qual è la tua posizione nella pagina dei risultati? La posizione 1 ottiene circa il 36% dei clic, la posizione 10 quasi nulla.

Nei motori generativi, è molto più complesso. I tuoi contenuti possono essere:

Citati una volta in cima alla risposta (alta visibilità)
Citati cinque volte ma sepolti in fondo (visibilità media)
Utilizzati per informare la risposta ma mai esplicitamente citati (visibilità zero)

I ricercatori hanno proposto tre modi per misurare la visibilità:

1. Conteggio parole (Word Count)

Quante parole nella risposta dell'IA sono attribuite alla tua fonte, rispetto alla risposta totale? Più parole = più visibilità.

2. Conteggio parole aggiustato per la posizione

Lo stesso, ma le parole che appaiono prima nella risposta contano di più (perché le persone leggono l'inizio con più attenzione). Questo utilizza un decadimento esponenziale — essere citati per primi vale molto di più che essere citati per ultimi.

3. Impressione soggettiva

Un punteggio multidimensionale che copre: la pertinenza rispetto alla query, l'influenza sulla risposta, l'unicità del tuo contributo, la probabilità che l'utente clicchi sulla tua citazione, e la diversità del materiale presentato.

Le 9 strategie di ottimizzazione testate

I ricercatori hanno testato 9 modi diversi di modificare il contenuto di un sito web e misurato se ciascuno migliorava la visibilità nelle risposte dei motori generativi.

Ce che non funziona

Strategia	Cosa fa	Risultato
Keyword stuffing	Aggiungere più parole chiave della query nei tuoi contenuti	Peggio di non fare nulla. Il trucco preferito del SEO tradizionale è inutile qui — i LLM comprendono il significato, non solo le parole chiave.
Parole uniche	Aggiungere vocabolario raro/inusuale	Nessun miglioramento significativo.

Cosa funziona

Strategia	Cosa fa	Miglioramento
Aggiunta di citazioni	Aggiungere citazioni pertinenti da fonti credibili	+40% di visibilità (miglior risultato)
Aggiunta di statistiche	Sostituire le affermazioni vaghe con numeri e dati precisi	+30% di visibilità
Citare le fonti	Aggiungere riferimenti e citazioni verso fonti autorevoli	+27% di visibilità
Ottimizzazione della fluidità	Migliorare la leggibilità e il flusso della scrittura	+25% di visibilità
Termini tecnici	Utilizzare una terminologia precisa e specifica del dominio	+15% di visibilità
Facile da capire	Semplificare il linguaggio per un'accessibilità più ampia	+14% di visibilità
Tono autorevole	Scrivere in uno stile più persuasivo e sicuro	+10% di visibilità

Le tre migliori strategie hanno un punto in comune: aggiungono segnali di credibilità. Le citazioni, le statistiche e i riferimenti rendono il contenuto più affidabile — e i motori generativi lo premiano.

La scoperta più sorprendente: il GEO aiuta i piccoli

Quando i ricercatori hanno testato cosa succede quando tutti i siti ottimizzano simultaneamente, hanno trovato qualcosa di notevole:

I siti classificati #5 su Google (gli outsider) hanno visto guadagni di visibilità fino a +115%
I siti classificati #1 su Google (i grandi attori) hanno visto la loro visibilità calare del 30%

Perché? I ranking tradizionali di Google dipendono fortemente dai backlink, dall'autorità del dominio e dalla notorietà del marchio — cose che favoriscono le grandi aziende. Ma i motori generativi si interessano di più alla qualità del contenuto. Quando un piccolo blog aggiunge citazioni solide e statistiche, l'IA lo tratta con la stessa serietà del sito di una grande impresa.

È potenzialmente un grande livellatore per i creatori indipendenti e le piccole imprese.

Il settore conta: una taglia unica non va bene per tutti

Le strategie più efficaci dipendono dal tuo argomento:

Strategia	Funziona meglio per
Tono autorevole	Argomenti di dibattito, Storia, Scienza
Ottimizzazione della fluidità	Business, Scienza, Salute
Citare le fonti	Affermazioni fattuali, Diritto e Governo
Aggiunta di citazioni	Società, Spiegazioni, Storia
Aggiunta di statistiche	Diritto e Governo, Dibattito, Articoli d'opinione

Un blog giuridico dovrebbe concentrarsi sull'aggiunta di statistiche e citazioni. Un sito di storia dovrebbe aggiungere citazioni dirette. Un sito di salute dovrebbe migliorare la fluidità. Non esiste una "migliore" strategia universale.

Combinare le strategie funziona ancora meglio

I ricercatori hanno anche testato coppie di strategie insieme. La combinazione vincente:

Ottimizzazione della fluidità + Aggiunta di statistiche = +35,8% di visibilità

Questo supera qualsiasi strategia individuale di più di 5 punti percentuali. La lezione: non scegliere un solo approccio — sovrapponi le strategie.

Aggiungere riferimenti in combinazione con altri metodi era anche particolarmente potente. Sebbene "Citare le fonti" da solo non fosse il migliore, migliorava sistematicamente i risultati in combinazione con altre strategie (media del +31,4% in combinazione).

Validazione in condizioni reali: funziona anche su Perplexity.ai

I ricercatori non hanno testato solo sul proprio motore simulato. Hanno anche condotto esperimenti su Perplexity.ai, un vero motore di ricerca generativo con milioni di utenti.

I risultati reggono:

Aggiunta di citazioni: +22% sulla visibilità aggiustata per la posizione
Aggiunta di statistiche: +37% sull'impressione soggettiva
Keyword stuffing: -10% (ancora peggio di non fare nulla su un vero motore)

Questo conferma che le strategie si generalizzano al di là del laboratorio.

Consigli pratici per i creatori di contenuti

Se crei contenuti sul web — che tu gestisca un blog, un sito aziendale o un e-commerce — ecco cosa fare:

Smetti con il keyword stuffing. Non funziona per la ricerca IA. I LLM comprendono il contesto, non la densità di parole chiave.
Aggiungi dati reali. Sostituisci "le vendite sono aumentate significativamente" con "le vendite sono aumentate del 47% su base annua (Fonte: Rapporto di Settore 2024)."
Cita gli esperti. Includi citazioni dirette da autorità riconosciute nel tuo settore.
Cita le tue fonti. Fai riferimento e linka a fonti credibili e autorevoli.
Scrivi in modo chiaro. Migliora il flusso e la leggibilità dei tuoi contenuti.
Adatta al tuo settore. Scegli le strategie che corrispondono al tuo tipo di contenuto.
Sovrapponi le strategie. Combina 2-3 approcci per un impatto massimo.

La visione d'insieme

Questo paper, pubblicato a KDD 2024 (una delle più grandi conferenze in data science), ha essenzialmente creato un nuovo campo. Prima del GEO, i creatori di contenuti non avevano alcun framework per pensare alla visibilità nella ricerca IA. Dalla sua pubblicazione, il campo è esploso — con più di una dozzina di paper di follow-up nel 2025-2026 che coprono sistemi GEO agentici, applicazioni e-commerce, ottimizzazione multimodale e molto altro.

L'insight fondamentale resta: i motori generativi premiano la qualità del contenuto, la credibilità e la chiarezza piuttosto che il playbook SEO tradizionale di backlink e parole chiave. Per i creatori di contenuti pronti ad adattarsi, è sia una sfida che un'opportunità.

GEO-bench: il benchmark

Il paper ha anche pubblicato GEO-bench, un benchmark di 10.000 query diverse che coprono 25 settori, 9 tipi di query e diversi livelli di difficoltà. Include:

Query reali di utenti Bing (MS MARCO), Google (Natural Questions, ORCAS)
Domande accademiche impegnative (All Souls College, Oxford)
Query di tendenza di Perplexity.ai
Domande ELI5 (Explain Like I'm 5) da Reddit
Query generate da GPT-4 per la diversità

Questo benchmark è disponibile pubblicamente ed è diventato il banco di prova standard per la ricerca GEO.

Paper: Aggarwal, P., Murahari, V., Rajpurohit, T., Kalyan, A., Narasimhan, K., & Deshpande, A. (2024). GEO: Generative Engine Optimization. Proceedings of KDD 2024. arXiv:2311.09735

GEO: Il paper fondatore, semplificato