85% des pages récupérées par ChatGPT ne sont jamais citées : les leçons de l’étude AirOps

AirOps vient de publier la plus grande étude à ce jour sur le mécanisme de citation de ChatGPT : 548 534 pages analysées, 15 000 prompts, 43 233 requêtes réelles. Le constat est brutal, être crawlé par ChatGPT ne suffit pas. Seules 15 % des pages découvertes finissent par être citées. Voici comment fonctionne la sélection, et comment maximiser vos chances.

Les chiffres clés de l'étude

L'étude d'AirOps, publiée le 13 mars 2026, est la première à quantifier à grande échelle l'écart entre la découverte et la citation dans ChatGPT. Les données sont sans appel.

548 534 Pages récupérées par ChatGPT
82 108 Citations dans les réponses finales
15% des pages récupérées sont effectivement citées
85% des pages trouvées sont ignorées dans la réponse

Autrement dit : ChatGPT récupère environ 6 fois plus de pages qu'il n'en cite. 85 % des sources découvertes pendant la phase de recherche sont évaluées puis écartées — elles ne sont jamais visibles pour l'utilisateur.

Le taux de citation varie selon le type de requête :

Type de requête Taux de citation
Découverte produit 18,3%
How-to / tutoriels 16,9%
Recherches de validation 11,3%

Les requêtes de découverte produit sont les mieux servies — logique, puisque ChatGPT a besoin de recommander des sources spécifiques. Les requêtes de validation (vérifier une info déjà connue) génèrent moins de citations car l'IA a moins besoin de sources externes pour confirmer des faits établis.

Le constat clé
Être crawlé par ChatGPT ne signifie pas être visible dans ses réponses. La découverte est la première étape, pas la dernière. L'optimisation doit viser la sélection — c'est-à-dire ce qui fait qu'une page passe du pool de recherche à la réponse finale. C'est un changement de paradigme par rapport au SEO classique.

Fan-out queries : le mécanisme invisible qui décide tout

La découverte la plus importante de l'étude concerne les fan-out queries — un mécanisme que la plupart des SEO ignorent encore.

Quand vous posez une question à ChatGPT, l'IA ne cherche pas uniquement cette requête. Elle génère automatiquement des sous-requêtes complémentaires pour couvrir le sujet en profondeur avant de synthétiser sa réponse. Par exemple, si vous demandez "Quel logiciel de gestion documentaire choisir ?", ChatGPT va aussi chercher les critères de sécurité, les comparatifs de prix, les fonctionnalités spécifiques, les avis utilisateurs — le tout en parallèle.

89,6% des prompts déclenchent 2+ recherches de suivi
×2,9 15 000 prompts → 43 233 requêtes réelles
32,9% des pages citées trouvées uniquement via fan-out
95% des fan-out queries ont 0 volume de recherche

Les implications sont majeures. Près d'un tiers des pages citées par ChatGPT n'apparaissent pas dans les résultats de la requête principale — elles sont découvertes uniquement via les sous-requêtes générées automatiquement. Et 95 % de ces fan-out queries n'ont aucun volume de recherche traditionnel. Elles sont invisibles pour vos outils de keyword tracking.

C'est une surface de citation entière qui échappe au radar du SEO classique. Vous pouvez dominer la requête principale et être absent des sous-requêtes — auquel cas ChatGPT citera votre concurrent qui couvre mieux les questions connexes.

Ce que ça signifie en pratique
Optimiser pour les citations ChatGPT ne se résume pas à cibler un mot-clé. Il faut couvrir le sujet entier — la question principale ET ses sous-questions probables. C'est exactement la logique des clusters de contenu et du cocon sémantique, mais appliquée aux mécanismes de recherche de l'IA.

Le rôle du classement Google dans les citations ChatGPT

L'étude confirme que le classement Google reste un facteur fort — mais insuffisant à lui seul.

Position Google Impact sur les citations ChatGPT
Position 1 Cité 3,5× plus souvent que les pages hors top 20
Top 20 55,8% des pages citées en proviennent
Au-delà du top 20 44,2% des citations — la longue traîne n'est pas morte

Deux lectures complémentaires de ces données :

Le SEO classique reste fondamental. Être bien classé sur Google multiplie vos chances d'être cité par ChatGPT. Les pages en position 1 sont massivement favorisées. Si vous investissez dans votre stratégie SEO, vous construisez aussi votre visibilité IA — les deux sont liés.

Mais le classement seul ne suffit plus. 44,2 % des pages citées viennent de positions au-delà du top 20. Ces pages sont sélectionnées pour leur contenu sur les fan-out queries, pas pour leur classement sur la requête principale. Une page en position 30 mais qui couvre précisément une sous-question générée par ChatGPT peut être citée quand une page en position 1 est ignorée.

Une autre étude complémentaire montre que ChatGPT cite massivement depuis le haut de la page : 43,7 % des citations proviennent des 30 premiers pourcent du contenu dans le secteur finance, et le premier 10-20 % du contenu performe le mieux dans toutes les industries. Les conclusions de vos articles sont largement ignorées (2,4 à 4,4 % des citations seulement).

La règle d'or
Placez vos informations les plus précieuses — réponses directes, données chiffrées, faits clés — dans le premier tiers de votre page. C'est là que 44 % de toutes les citations sont sourcées. Ne faites pas défiler l'IA jusqu'à votre conclusion pour trouver la réponse.

Pourquoi votre page est ignorée (même si elle est trouvée)

L'étude AirOps, combinée aux données de structure d'AirOps et d'autres études de mars 2026, permet d'identifier les facteurs qui séparent les pages citées des pages ignorées.

Les pages citées ont en commun :

  • Une hiérarchie de titres propre : 68,7 % des pages citées dans ChatGPT suivent une hiérarchie séquentielle de titres (H1 → H2 → H3 sans sauts). 87 % utilisent un H1 unique.
  • Des listes et tableaux : près de 80 % des pages citées incluent des listes pour structurer l'information. Les tableaux sont 2 fois plus susceptibles d'apparaître dans les résultats ChatGPT que dans Google Search.
  • Du schema JSON-LD riche : 61 % des pages citées utilisent 3 types de schema ou plus. Les pages avec 3+ schemas ont 13 % de chances supplémentaires d'être citées.
  • Une longueur substantielle : les pages de plus de 20 000 caractères obtiennent en moyenne 10,18 citations vs 2,39 pour celles de moins de 500 caractères. Le sweet spot se situe entre 5 000 et 10 000 caractères.
  • Du contenu frais : 85 % des citations IA proviennent de contenus publiés dans les 2 dernières années. Le contenu non mis à jour depuis 3+ mois voit ses citations chuter fortement.

Les pages ignorées partagent ces défauts :

  • Pas de réponse directe dans les premiers paragraphes — l'intro est trop longue ou trop vague.
  • Contenu générique qui reformule ce qui existe déjà — aucune donnée originale, aucun point de vue unique.
  • Structure HTML pauvre — blocs de texte denses, pas de listes, hiérarchie de titres incohérente.
  • Couverture étroite du sujet — la page répond à la question principale mais pas aux questions connexes que les fan-out queries génèrent.
  • Absence de signaux de confiance — pas de page auteur, pas de schema Organization, pas de sources citées.

Comment maximiser vos chances d'être cité

En combinant les enseignements de l'étude AirOps avec les bonnes pratiques AEO et de structuration HTML, voici un plan d'action priorisé.

Priorité 1 : Couvrir le sujet, pas juste le mot-clé

Puisque 32,9 % des citations viennent des fan-out queries, votre page doit répondre à la question principale et aux sous-questions probables. Pensez "guide complet" plutôt que "article ciblé". Pour chaque contenu, identifiez les 5-8 sous-questions que ChatGPT pourrait générer et couvrez-les dans des sections dédiées avec des H2/H3 clairs.

Priorité 2 : Réponse en haut de page, données partout

Placez la réponse à la question principale dans les 2 premiers paragraphes. Disséminez des données chiffrées, des statistiques et des faits concrets tout au long du contenu — idéalement toutes les 150-200 mots. L'IA extrait préférentiellement les passages avec des données vérifiables.

Priorité 3 : Structurer pour l'extraction machine

  • Un seul H1. Hiérarchie H2 → H3 séquentielle, sans sauts.
  • Listes à puces et tableaux pour les comparaisons et données.
  • Paragraphes courts (2-4 phrases).
  • Schema JSON-LD : Article + FAQPage + Organization minimum. Ajoutez Product, LocalBusiness, HowTo selon le contexte.

Priorité 4 : Construire des clusters thématiques

L'étude montre que les fan-out queries couvrent des angles connexes au sujet principal. Un site qui a des articles approfondis sur chaque sous-thème a mécaniquement plus de chances d'être cité — sur la requête principale et sur les sous-requêtes. Investissez dans des clusters de contenu plutôt que dans des pages isolées.

Priorité 5 : Mettre à jour régulièrement

Les contenus frais sont surreprésentés dans les citations. Mettez à jour vos pages stratégiques chaque trimestre avec de nouvelles données, un horodatage "dernière mise à jour", et des informations actualisées. Un article evergreen non mis à jour depuis 6 mois perd progressivement sa visibilité IA.

Votre contenu est-il structuré pour être cité par l'IA ?

J'intègre l'analyse de citabilité IA dans mes audits SEO : structure HTML, couverture thématique, données structurées et signaux de confiance.

Demander mon audit gratuit →

Questions fréquentes

Pourquoi ChatGPT ne cite-t-il que 15% des pages qu'il récupère ?
ChatGPT récupère un large pool de sources, puis sélectionne uniquement celles qui correspondent le mieux au prompt, au contexte et aux sous-questions générées automatiquement (fan-out queries). La sélection se fait sur la pertinence du passage, la clarté de l'information et la fiabilité perçue — pas uniquement sur le classement Google.
C'est quoi une fan-out query ?
Quand un utilisateur pose une question à ChatGPT, l'IA génère automatiquement des sous-requêtes complémentaires pour couvrir le sujet en profondeur. L'étude AirOps montre que 89,6 % des prompts déclenchent au moins 2 recherches de suivi, transformant 15 000 requêtes initiales en 43 233 recherches. 95 % de ces sous-requêtes n'ont aucun volume de recherche traditionnel — elles sont invisibles pour les outils de keyword tracking.
Le classement Google influence-t-il les citations ChatGPT ?
Oui, fortement. 55,8 % des pages citées se classent dans le top 20 Google, et les pages en position 1 sont citées 3,5 fois plus souvent. Mais 44,2 % des citations viennent de positions plus basses — sélectionnées pour leur contenu sur les sous-requêtes. Le SEO reste fondamental, mais ne suffit plus seul.
Comment augmenter ses chances d'être cité par ChatGPT ?
Couvrez le sujet en profondeur (pas seulement le mot-clé principal), structurez avec des listes et tableaux, placez les infos clés dans les premiers 30 % de la page, incluez des données chiffrées, et maintenez une hiérarchie de titres propre. Les pages avec 3+ types de schema JSON-LD ont 13 % plus de chances d'être citées. Pour le détail, consultez notre guide AEO complet.
Quelle longueur de contenu est idéale ?
Les pages de 5 000 à 10 000 caractères offrent le meilleur rapport longueur/citations. Les pages de plus de 20 000 caractères obtiennent en moyenne 10 citations contre 2,4 pour les pages de moins de 500 caractères. Mais la longueur seule ne suffit pas : c'est la densité informationnelle et la structure qui font la différence.

Pour aller plus loin

Tags
Qu'en avez-vous pensé ?
Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Ces articles pourraient vous interesser :