AirOps vient de publier la plus grande étude à ce jour sur le mécanisme de citation de ChatGPT : 548 534 pages analysées, 15 000 prompts, 43 233 requêtes réelles. Le constat est brutal, être crawlé par ChatGPT ne suffit pas. Seules 15 % des pages découvertes finissent par être citées. Voici comment fonctionne la sélection, et comment maximiser vos chances.
Les chiffres clés de l'étude
L'étude d'AirOps, publiée le 13 mars 2026, est la première à quantifier à grande échelle l'écart entre la découverte et la citation dans ChatGPT. Les données sont sans appel.
Autrement dit : ChatGPT récupère environ 6 fois plus de pages qu'il n'en cite. 85 % des sources découvertes pendant la phase de recherche sont évaluées puis écartées — elles ne sont jamais visibles pour l'utilisateur.
Le taux de citation varie selon le type de requête :
| Type de requête | Taux de citation |
|---|---|
| Découverte produit | 18,3% |
| How-to / tutoriels | 16,9% |
| Recherches de validation | 11,3% |
Les requêtes de découverte produit sont les mieux servies — logique, puisque ChatGPT a besoin de recommander des sources spécifiques. Les requêtes de validation (vérifier une info déjà connue) génèrent moins de citations car l'IA a moins besoin de sources externes pour confirmer des faits établis.
Fan-out queries : le mécanisme invisible qui décide tout
La découverte la plus importante de l'étude concerne les fan-out queries — un mécanisme que la plupart des SEO ignorent encore.
Quand vous posez une question à ChatGPT, l'IA ne cherche pas uniquement cette requête. Elle génère automatiquement des sous-requêtes complémentaires pour couvrir le sujet en profondeur avant de synthétiser sa réponse. Par exemple, si vous demandez "Quel logiciel de gestion documentaire choisir ?", ChatGPT va aussi chercher les critères de sécurité, les comparatifs de prix, les fonctionnalités spécifiques, les avis utilisateurs — le tout en parallèle.
Les implications sont majeures. Près d'un tiers des pages citées par ChatGPT n'apparaissent pas dans les résultats de la requête principale — elles sont découvertes uniquement via les sous-requêtes générées automatiquement. Et 95 % de ces fan-out queries n'ont aucun volume de recherche traditionnel. Elles sont invisibles pour vos outils de keyword tracking.
C'est une surface de citation entière qui échappe au radar du SEO classique. Vous pouvez dominer la requête principale et être absent des sous-requêtes — auquel cas ChatGPT citera votre concurrent qui couvre mieux les questions connexes.
Le rôle du classement Google dans les citations ChatGPT
L'étude confirme que le classement Google reste un facteur fort — mais insuffisant à lui seul.
| Position Google | Impact sur les citations ChatGPT |
|---|---|
| Position 1 | Cité 3,5× plus souvent que les pages hors top 20 |
| Top 20 | 55,8% des pages citées en proviennent |
| Au-delà du top 20 | 44,2% des citations — la longue traîne n'est pas morte |
Deux lectures complémentaires de ces données :
Le SEO classique reste fondamental. Être bien classé sur Google multiplie vos chances d'être cité par ChatGPT. Les pages en position 1 sont massivement favorisées. Si vous investissez dans votre stratégie SEO, vous construisez aussi votre visibilité IA — les deux sont liés.
Mais le classement seul ne suffit plus. 44,2 % des pages citées viennent de positions au-delà du top 20. Ces pages sont sélectionnées pour leur contenu sur les fan-out queries, pas pour leur classement sur la requête principale. Une page en position 30 mais qui couvre précisément une sous-question générée par ChatGPT peut être citée quand une page en position 1 est ignorée.
Une autre étude complémentaire montre que ChatGPT cite massivement depuis le haut de la page : 43,7 % des citations proviennent des 30 premiers pourcent du contenu dans le secteur finance, et le premier 10-20 % du contenu performe le mieux dans toutes les industries. Les conclusions de vos articles sont largement ignorées (2,4 à 4,4 % des citations seulement).
Pourquoi votre page est ignorée (même si elle est trouvée)
L'étude AirOps, combinée aux données de structure d'AirOps et d'autres études de mars 2026, permet d'identifier les facteurs qui séparent les pages citées des pages ignorées.
Les pages citées ont en commun :
- Une hiérarchie de titres propre : 68,7 % des pages citées dans ChatGPT suivent une hiérarchie séquentielle de titres (H1 → H2 → H3 sans sauts). 87 % utilisent un H1 unique.
- Des listes et tableaux : près de 80 % des pages citées incluent des listes pour structurer l'information. Les tableaux sont 2 fois plus susceptibles d'apparaître dans les résultats ChatGPT que dans Google Search.
- Du schema JSON-LD riche : 61 % des pages citées utilisent 3 types de schema ou plus. Les pages avec 3+ schemas ont 13 % de chances supplémentaires d'être citées.
- Une longueur substantielle : les pages de plus de 20 000 caractères obtiennent en moyenne 10,18 citations vs 2,39 pour celles de moins de 500 caractères. Le sweet spot se situe entre 5 000 et 10 000 caractères.
- Du contenu frais : 85 % des citations IA proviennent de contenus publiés dans les 2 dernières années. Le contenu non mis à jour depuis 3+ mois voit ses citations chuter fortement.
Les pages ignorées partagent ces défauts :
- Pas de réponse directe dans les premiers paragraphes — l'intro est trop longue ou trop vague.
- Contenu générique qui reformule ce qui existe déjà — aucune donnée originale, aucun point de vue unique.
- Structure HTML pauvre — blocs de texte denses, pas de listes, hiérarchie de titres incohérente.
- Couverture étroite du sujet — la page répond à la question principale mais pas aux questions connexes que les fan-out queries génèrent.
- Absence de signaux de confiance — pas de page auteur, pas de schema Organization, pas de sources citées.
Comment maximiser vos chances d'être cité
En combinant les enseignements de l'étude AirOps avec les bonnes pratiques AEO et de structuration HTML, voici un plan d'action priorisé.
Priorité 1 : Couvrir le sujet, pas juste le mot-clé
Puisque 32,9 % des citations viennent des fan-out queries, votre page doit répondre à la question principale et aux sous-questions probables. Pensez "guide complet" plutôt que "article ciblé". Pour chaque contenu, identifiez les 5-8 sous-questions que ChatGPT pourrait générer et couvrez-les dans des sections dédiées avec des H2/H3 clairs.
Priorité 2 : Réponse en haut de page, données partout
Placez la réponse à la question principale dans les 2 premiers paragraphes. Disséminez des données chiffrées, des statistiques et des faits concrets tout au long du contenu — idéalement toutes les 150-200 mots. L'IA extrait préférentiellement les passages avec des données vérifiables.
Priorité 3 : Structurer pour l'extraction machine
- Un seul H1. Hiérarchie H2 → H3 séquentielle, sans sauts.
- Listes à puces et tableaux pour les comparaisons et données.
- Paragraphes courts (2-4 phrases).
- Schema JSON-LD : Article + FAQPage + Organization minimum. Ajoutez Product, LocalBusiness, HowTo selon le contexte.
Priorité 4 : Construire des clusters thématiques
L'étude montre que les fan-out queries couvrent des angles connexes au sujet principal. Un site qui a des articles approfondis sur chaque sous-thème a mécaniquement plus de chances d'être cité — sur la requête principale et sur les sous-requêtes. Investissez dans des clusters de contenu plutôt que dans des pages isolées.
Priorité 5 : Mettre à jour régulièrement
Les contenus frais sont surreprésentés dans les citations. Mettez à jour vos pages stratégiques chaque trimestre avec de nouvelles données, un horodatage "dernière mise à jour", et des informations actualisées. Un article evergreen non mis à jour depuis 6 mois perd progressivement sa visibilité IA.
Votre contenu est-il structuré pour être cité par l'IA ?
J'intègre l'analyse de citabilité IA dans mes audits SEO : structure HTML, couverture thématique, données structurées et signaux de confiance.
Demander mon audit gratuit →Questions fréquentes
Pour aller plus loin
- ChatGPT et les citations SEO — Les fondamentaux du mécanisme de citation et comment optimiser votre contenu.
- AEO : comment être cité par ChatGPT, Perplexity et Google AI — Le framework en 5 étapes pour structurer du contenu citable.
- Comment Google parse le HTML pour le SEO — Les fondamentaux de structuration qui comptent aussi pour l'extraction IA.
- GEO : votre réputation influence les réponses de ChatGPT — La dimension off-site : mentions, avis et consensus de marque.