GEO: Generative Engine Optimization — Il paper fondatore, semplificato
Basato sul paper "GEO: Generative Engine Optimization" di Aggarwal, Murahari, Rajpurohit, Kalyan, Narasimhan & Deshpande (Princeton University / IIT Delhi). Pubblicato a KDD 2024.
Paper: arXiv:2311.09735 | Codice: github.com/GEO-optim/GEO
Il problema: la ricerca IA uccide il traffico web
Per 25 anni, quando cercavi qualcosa su Google, ottenevi una lista di link blu. Cliccavi su uno di essi, visitavi un sito, e il proprietario del sito riceveva traffico. Tutti contenti.
Poi sono arrivati i motori di ricerca generativi — strumenti come ChatGPT, Perplexity, Google AI Overviews e Bing Copilot. Invece di darti dei link, leggono diversi siti web, sintetizzano le informazioni e ti danno una risposta diretta. Ottieni ciò di cui hai bisogno senza mai cliccare sulla fonte originale.
È fantastico per gli utenti. Ma è una catastrofe per i milioni di siti web, blog, piccole imprese e creatori di contenuti che dipendono da quel traffico per vivere.
I ricercatori dietro a questo paper hanno identificato tre parti interessate in questo nuovo mondo:
- Gli utenti — ci guadagnano (risposte più rapide e migliori)
- I fornitori di motori generativi — ci guadagnano (più utenti, più ricavi)
- I creatori di contenuti — ci perdono (meno traffico, meno visibilità)
Il paper pone una domanda semplice: I creatori di contenuti possono fare qualcosa?
Cos'è il GEO?
Il Generative Engine Optimization (GEO) è il nuovo equivalente del SEO, ma per i motori di ricerca alimentati dall'IA.
- SEO = ottimizzare i tuoi contenuti affinché Google li posizioni più in alto nella sua lista di link
- GEO = ottimizzare i tuoi contenuti affinché i motori di ricerca IA li citino e li utilizzino in modo più visibile nelle loro risposte generate
La differenza chiave: nella ricerca tradizionale, la visibilità significa "apparire più in alto in una lista ordinata." Nella ricerca generativa, la visibilità significa "quale parte della risposta dell'IA proviene dai tuoi contenuti e vieni accreditato."
Come funzionano realmente i motori di ricerca generativi?
Il paper formalizza ciò che chiamano un Generative Engine (GE). Ecco il pipeline semplificato:
- Fai una domanda (es.: "Qual è il segreto del cioccolato svizzero?")
- Il motore riformula la tua query in sotto-query più semplici, più facili da cercare
- Un motore di ricerca tradizionale (come Google) recupera le pagine web più pertinenti
- Un LLM riassume ogni fonte
- Un altro LLM genera una risposta finale, intrecciando le informazioni di più fonti con citazioni inline
Il risultato è una risposta ricca e strutturata — non una lista di link. Il tuo sito web è forse una delle fonti utilizzate, ma l'utente potrebbe non visitarlo mai.
La grande sfida: come misurare la visibilità?
Su Google, la visibilità è semplice: qual è la tua posizione nella pagina dei risultati? La posizione 1 ottiene circa il 36% dei clic, la posizione 10 quasi nulla.
Nei motori generativi, è molto più complesso. I tuoi contenuti possono essere:
- Citati una volta in cima alla risposta (alta visibilità)
- Citati cinque volte ma sepolti in fondo (visibilità media)
- Utilizzati per informare la risposta ma mai esplicitamente citati (visibilità zero)
I ricercatori hanno proposto tre modi per misurare la visibilità:
1. Conteggio parole (Word Count)
Quante parole nella risposta dell'IA sono attribuite alla tua fonte, rispetto alla risposta totale? Più parole = più visibilità.
2. Conteggio parole aggiustato per la posizione
Lo stesso, ma le parole che appaiono prima nella risposta contano di più (perché le persone leggono l'inizio con più attenzione). Questo utilizza un decadimento esponenziale — essere citati per primi vale molto di più che essere citati per ultimi.
3. Impressione soggettiva
Un punteggio multidimensionale che copre: la pertinenza rispetto alla query, l'influenza sulla risposta, l'unicità del tuo contributo, la probabilità che l'utente clicchi sulla tua citazione, e la diversità del materiale presentato.
Le 9 strategie di ottimizzazione testate
I ricercatori hanno testato 9 modi diversi di modificare il contenuto di un sito web e misurato se ciascuno migliorava la visibilità nelle risposte dei motori generativi.
Ce che non funziona
| Strategia | Cosa fa | Risultato |
|---|---|---|
| Keyword stuffing | Aggiungere più parole chiave della query nei tuoi contenuti | Peggio di non fare nulla. Il trucco preferito del SEO tradizionale è inutile qui — i LLM comprendono il significato, non solo le parole chiave. |
| Parole uniche | Aggiungere vocabolario raro/inusuale | Nessun miglioramento significativo. |
Cosa funziona
| Strategia | Cosa fa | Miglioramento |
|---|---|---|
| Aggiunta di citazioni | Aggiungere citazioni pertinenti da fonti credibili | +40% di visibilità (miglior risultato) |
| Aggiunta di statistiche | Sostituire le affermazioni vaghe con numeri e dati precisi | +30% di visibilità |
| Citare le fonti | Aggiungere riferimenti e citazioni verso fonti autorevoli | +27% di visibilità |
| Ottimizzazione della fluidità | Migliorare la leggibilità e il flusso della scrittura | +25% di visibilità |
| Termini tecnici | Utilizzare una terminologia precisa e specifica del dominio | +15% di visibilità |
| Facile da capire | Semplificare il linguaggio per un'accessibilità più ampia | +14% di visibilità |
| Tono autorevole | Scrivere in uno stile più persuasivo e sicuro | +10% di visibilità |
Le tre migliori strategie hanno un punto in comune: aggiungono segnali di credibilità. Le citazioni, le statistiche e i riferimenti rendono il contenuto più affidabile — e i motori generativi lo premiano.
La scoperta più sorprendente: il GEO aiuta i piccoli
Quando i ricercatori hanno testato cosa succede quando tutti i siti ottimizzano simultaneamente, hanno trovato qualcosa di notevole:
- I siti classificati #5 su Google (gli outsider) hanno visto guadagni di visibilità fino a +115%
- I siti classificati #1 su Google (i grandi attori) hanno visto la loro visibilità calare del 30%
Perché? I ranking tradizionali di Google dipendono fortemente dai backlink, dall'autorità del dominio e dalla notorietà del marchio — cose che favoriscono le grandi aziende. Ma i motori generativi si interessano di più alla qualità del contenuto. Quando un piccolo blog aggiunge citazioni solide e statistiche, l'IA lo tratta con la stessa serietà del sito di una grande impresa.
È potenzialmente un grande livellatore per i creatori indipendenti e le piccole imprese.
Il settore conta: una taglia unica non va bene per tutti
Le strategie più efficaci dipendono dal tuo argomento:
| Strategia | Funziona meglio per |
|---|---|
| Tono autorevole | Argomenti di dibattito, Storia, Scienza |
| Ottimizzazione della fluidità | Business, Scienza, Salute |
| Citare le fonti | Affermazioni fattuali, Diritto e Governo |
| Aggiunta di citazioni | Società, Spiegazioni, Storia |
| Aggiunta di statistiche | Diritto e Governo, Dibattito, Articoli d'opinione |
Un blog giuridico dovrebbe concentrarsi sull'aggiunta di statistiche e citazioni. Un sito di storia dovrebbe aggiungere citazioni dirette. Un sito di salute dovrebbe migliorare la fluidità. Non esiste una "migliore" strategia universale.
Combinare le strategie funziona ancora meglio
I ricercatori hanno anche testato coppie di strategie insieme. La combinazione vincente:
Ottimizzazione della fluidità + Aggiunta di statistiche = +35,8% di visibilità
Questo supera qualsiasi strategia individuale di più di 5 punti percentuali. La lezione: non scegliere un solo approccio — sovrapponi le strategie.
Aggiungere riferimenti in combinazione con altri metodi era anche particolarmente potente. Sebbene "Citare le fonti" da solo non fosse il migliore, migliorava sistematicamente i risultati in combinazione con altre strategie (media del +31,4% in combinazione).
Validazione in condizioni reali: funziona anche su Perplexity.ai
I ricercatori non hanno testato solo sul proprio motore simulato. Hanno anche condotto esperimenti su Perplexity.ai, un vero motore di ricerca generativo con milioni di utenti.
I risultati reggono:
- Aggiunta di citazioni: +22% sulla visibilità aggiustata per la posizione
- Aggiunta di statistiche: +37% sull'impressione soggettiva
- Keyword stuffing: -10% (ancora peggio di non fare nulla su un vero motore)
Questo conferma che le strategie si generalizzano al di là del laboratorio.
Consigli pratici per i creatori di contenuti
Se crei contenuti sul web — che tu gestisca un blog, un sito aziendale o un e-commerce — ecco cosa fare:
- Smetti con il keyword stuffing. Non funziona per la ricerca IA. I LLM comprendono il contesto, non la densità di parole chiave.
- Aggiungi dati reali. Sostituisci "le vendite sono aumentate significativamente" con "le vendite sono aumentate del 47% su base annua (Fonte: Rapporto di Settore 2024)."
- Cita gli esperti. Includi citazioni dirette da autorità riconosciute nel tuo settore.
- Cita le tue fonti. Fai riferimento e linka a fonti credibili e autorevoli.
- Scrivi in modo chiaro. Migliora il flusso e la leggibilità dei tuoi contenuti.
- Adatta al tuo settore. Scegli le strategie che corrispondono al tuo tipo di contenuto.
- Sovrapponi le strategie. Combina 2-3 approcci per un impatto massimo.
La visione d'insieme
Questo paper, pubblicato a KDD 2024 (una delle più grandi conferenze in data science), ha essenzialmente creato un nuovo campo. Prima del GEO, i creatori di contenuti non avevano alcun framework per pensare alla visibilità nella ricerca IA. Dalla sua pubblicazione, il campo è esploso — con più di una dozzina di paper di follow-up nel 2025-2026 che coprono sistemi GEO agentici, applicazioni e-commerce, ottimizzazione multimodale e molto altro.
L'insight fondamentale resta: i motori generativi premiano la qualità del contenuto, la credibilità e la chiarezza piuttosto che il playbook SEO tradizionale di backlink e parole chiave. Per i creatori di contenuti pronti ad adattarsi, è sia una sfida che un'opportunità.
GEO-bench: il benchmark
Il paper ha anche pubblicato GEO-bench, un benchmark di 10.000 query diverse che coprono 25 settori, 9 tipi di query e diversi livelli di difficoltà. Include:
- Query reali di utenti Bing (MS MARCO), Google (Natural Questions, ORCAS)
- Domande accademiche impegnative (All Souls College, Oxford)
- Query di tendenza di Perplexity.ai
- Domande ELI5 (Explain Like I'm 5) da Reddit
- Query generate da GPT-4 per la diversità
Questo benchmark è disponibile pubblicamente ed è diventato il banco di prova standard per la ricerca GEO.
Paper: Aggarwal, P., Murahari, V., Rajpurohit, T., Kalyan, A., Narasimhan, K., & Deshpande, A. (2024). GEO: Generative Engine Optimization. Proceedings of KDD 2024. arXiv:2311.09735