Comment dominer la recherche IA : ce que révèle la plus grande étude comparative
Basé sur le papier "Generative Engine Optimization: How to Dominate AI Search" par Chen, Wang, Chen & Koudas (University of Toronto). Publié en septembre 2025.
Paper : arXiv:2509.08919
La question que tout le monde se pose
ChatGPT, Perplexity, Gemini — ces moteurs de recherche IA remplacent progressivement Google pour de plus en plus d'utilisateurs. Mais comment ces systèmes choisissent-ils leurs sources ? Sont-ils similaires à Google, ou fonctionnent-ils de manière radicalement différente ?
Ce papier apporte les premières réponses empiriques à grande échelle. Les chercheurs de l'Université de Toronto ont mené des expériences contrôlées sur plusieurs verticales, langues et reformulations de requêtes pour comparer la recherche IA à la recherche web traditionnelle.
Le protocole : une comparaison massive
Les chercheurs ont systématiquement comparé :
- Google (recherche traditionnelle)
- Plusieurs moteurs de recherche IA (ChatGPT, Perplexity, Gemini)
Sur plusieurs dimensions :
- Quels types de sources sont favorisés ?
- Quelle diversité de domaines ?
- Quelle fraîcheur du contenu ?
- Quelle stabilité entre les langues ?
- Quelle sensibilité à la reformulation des requêtes ?
Découverte #1 : le biais massif vers les médias "earned"
C'est le résultat le plus frappant du papier. Les chercheurs classent les sources en trois catégories :
| Type de média | Définition | Exemples |
|---|---|---|
| Brand-owned (propriétaire) | Contenu créé et contrôlé par la marque | Site officiel, blog d'entreprise |
| Earned (gagné) | Contenu tiers, indépendant et faisant autorité | Articles de presse, Wikipedia, avis experts |
| Social | Contenu des réseaux sociaux | Reddit, Twitter, forums |
Google présente un mix relativement équilibré entre ces trois types.
Les moteurs de recherche IA montrent un biais écrasant et systématique vers les médias "earned" — les sources tierces faisant autorité. Le contenu propriétaire des marques et le contenu social sont largement ignorés.
Concrètement : si vous êtes une marque et que vous comptez sur votre propre site pour être visible dans la recherche IA, vous avez un problème. Les moteurs IA préfèrent ce que les autres disent de vous plutôt que ce que vous dites de vous-même.
Découverte #2 : chaque moteur IA est différent
Contrairement à ce qu'on pourrait penser, les moteurs de recherche IA ne se comportent pas tous de la même façon :
- Diversité des domaines — certains moteurs citent beaucoup de sources différentes, d'autres se concentrent sur quelques domaines
- Fraîcheur — certains privilégient le contenu récent, d'autres non
- Stabilité cross-langue — une même requête en anglais et en français peut donner des sources très différentes
- Sensibilité à la reformulation — reformuler légèrement une question peut changer complètement les sources citées
Cela signifie qu'une stratégie GEO qui fonctionne sur ChatGPT ne fonctionnera pas nécessairement sur Perplexity ou Gemini. L'optimisation doit être spécifique au moteur.
Découverte #3 : le "big brand bias"
Les moteurs de recherche IA ont tendance à favoriser les grandes marques connues. Les acteurs de niche et les petites entreprises sont systématiquement sous-représentés dans les réponses générées.
C'est un paradoxe intéressant quand on le compare au papier fondateur du GEO qui montrait que le GEO pouvait aider les petits sites. La réalité est plus nuancée : le GEO peut aider les petits à gagner en visibilité une fois qu'ils sont dans le pool de documents considérés, mais le biais initial des moteurs IA favorise les grandes marques pour y entrer.
Les 4 piliers stratégiques du GEO selon cette étude
Basé sur leurs résultats empiriques, les chercheurs formulent un agenda stratégique en 4 points :
1. Ingénierie du contenu pour les machines
Votre contenu doit être scannable et justifiable par une machine. Cela signifie :
- Des affirmations claires et vérifiables
- Des données structurées
- Des sources citées que le LLM peut vérifier
2. Dominer les médias "earned"
Puisque les moteurs IA favorisent massivement les sources tierces, la stratégie la plus efficace est de faire parler de vous par d'autres. Articles de presse, mentions dans des publications faisant autorité, avis d'experts — c'est ce que les moteurs IA valorisent.
3. Stratégies spécifiques par moteur et par langue
Il n'y a pas de stratégie universelle. Chaque moteur IA a ses propres biais et préférences. De même, le comportement varie selon la langue de la requête. L'optimisation doit être adaptée.
4. Surmonter le biais "grande marque"
Pour les acteurs de niche, la clé est de construire une autorité perçue par l'IA à travers des signaux de crédibilité : citations, données, mentions dans des sources faisant autorité.
Ce que ça change par rapport au GEO classique
Le papier fondateur du GEO se concentrait sur comment modifier votre propre contenu (ajouter des stats, des citations, etc.). Cette étude ajoute une dimension cruciale : ce qui compte le plus, c'est ce que les autres disent de vous.
C'est un changement de paradigme. Le GEO n'est pas seulement un exercice d'optimisation on-page — c'est aussi une stratégie de relations publiques et de construction d'autorité.
Implications pratiques
- Pour les marques : investissez dans les RP et le earned media autant que dans l'optimisation de votre site
- Pour les créateurs de contenu : positionnez-vous comme source faisant autorité dans votre niche
- Pour les SEO : le GEO nécessite des stratégies différentes selon le moteur IA ciblé
- Pour les petites entreprises : concentrez-vous sur la construction d'autorité via des mentions tierces
Paper : Chen, M., Wang, X., Chen, K., & Koudas, N. (2025). Generative Engine Optimization: How to Dominate AI Search. arXiv:2509.08919