Query Fan-Out : le mécanisme qui décide si l'IA vous cite

Depuis que Nikola Todorovic, Director of Software Engineering chez Google Search, a ouvert le capot sur le fonctionnement interne de l’IA dans Search — lors du podcast Search Off the Record publié début mai 2026 une expression circule dans toutes les discussions SEO sérieuses : le query fan-out. J’irai même plus loin le sujet est ouvert depuis que les LLM ont débarqué en France et que les experts SEO et GEO on essayé de décrypter le fonctionnement de ces derniers.

Query fan out est un mécanisme documenté, qui explique pourquoi certains contenus sont systématiquement cités par les IA génératives et d’autres jamais même quand ces derniers sont techniquement excellents et bien positionnés sur Google.

Le sujet de fond n’est pas de savoir “Est-ce que mon contenu est bon ?”. Mais plutôt : “Est-ce que mon contenu est structuré pour répondre aux dizaines de sous-questions que l’IA va poser en votre nom ?”

Je suis consultant en Search Marketing SEO/GEO, j’accompagne avec Vu du Web, les marques dans cette transition. Découvrez mon approche ici →

1. Ce que Todorovic, ingénieur chez Google a dit

Dans son intervention sur Search Off the Record, l’ingénieur Google a décrit l’architecture de l’AI Overview avec une précision inhabituelle chez Google qui communique rarement sur ses mécanismes internes.

Ce qu’il a expliqué en détail :

Les AI Overviews s’appuient sur les systèmes de récupération et de classement existants de Google : le SEO traditionnel reste donc la fondation
L’AI Mode fonctionne sur une infrastructure plus indépendante, avec “une plus grande plateforme pour elle-même”
Le système peut déclencher des requêtes de fan-out : face à une question complexe, Google génère plusieurs sous-requêtes parallèles, récupère les résultats pour chacune, puis synthétise tout dans une réponse unique
Les modèles d’IA peuvent fonctionner “comme une boîte noire”, les ingénieurs ne comprennent pas toujours ce qui se passe en dessous, ce qui rend le débogage plus difficile

Ce dernier point est capital. Ce n’est pas un aveu d’impuissance, c’est l’explication de pourquoi l’optimisation pour l’IA ne suit pas les mêmes règles que l’optimisation pour le ranking classique.

1.1. Le query fan-out : définition

Quand vous tapez “quelle stratégie de contenu pour être cité par ChatGPT ?” dans l’AI Mode de Google, voici ce qui se passe :

Google ne cherche pas une réponse à cette question unique
Il décompose la requête en une série de sous-questions dérivées : “qu’est-ce que le GEO ?”, “quels formats de contenu citent les LLM ?”, “comment fonctionnent les AI Overviews ?”, “qu’est-ce que l’EEAT pour les IA ?”
Il envoie ces sous-requêtes en parallèle dans son moteur de recherche classique
Il récupère les meilleurs résultats pour chacune
Il synthétise l’ensemble en une réponse structurée

Vous n’êtes cité que si vous faites partie des meilleurs résultats pour au moins une de ces sous-requêtes générées automatiquement. Ce n’est plus une logique de “je ranke sur un mot-clé”. C’est une logique de “je couvre un territoire sémantique large et cohérent”.

1.2. AI Overviews vs AI Mode : deux logiques différentes

	AI Overviews	AI Mode
Infrastructure	Couche par-dessus le ranking classique	Plateforme plus indépendante
Fan-out	Limité, ciblé	Plus large, plus autonome
Implication SEO	Fondamentaux SEO critiques	Signaux d’autorité sémantique importants
Déploiement France	Pas encore	Non disponible

Pour les professionnels français : les AI Overviews ne sont toujours pas déployées en France à cette date. Mais la logique du fan-out s’applique déjà à ChatGPT, Perplexity et Gemini qui, eux, sont pleinement actifs sur les requêtes en français.

2. Ce que les données de 68 millions de visites de crawlers IA décryptées décrivent

Une étude publiée par Duda en avril 2026 sur 858 457 sites et 68,9 millions de visites de crawlers IA en février 2026 apporte des données concrètes qui illustrent parfaitement la logique du fan-out.

2.1. La concentration du marché du crawl IA

OpenAI (ChatGPT) : 55,8 millions de visites — 81 % du total
Anthropic (Claude) : 11,5 millions — 16,6 %
Perplexity : 1,3 million — 1,8 %
Google (Gemini) : 380 000 — 0,6 %

56,9 % de toute cette activité correspond à du User Fetch, du crawl en temps réel, déclenché par une requête utilisateur pour construire une réponse immédiate. Ce n’est plus du crawl d’indexation c’est du fan-out en action.

2.2. Ce qui détermine si vous êtes crawlé (et donc citable)

Facteur	Taux de crawl avec	Taux de crawl sans	Impact
Intégration Yext	97,1 %	~58 %	+39 points
Intégrations d’avis	89,8 %	58,8 %	+31 points
Synchro Google Business Profile	92,8 %	58,9 %	+34 points
Schema local	72,3 %	55,2 %	+17 points
50+ articles de blog	1 373 visites/mois	41 visites/mois	33x plus

Le dernier chiffre mérite qu’on s’y arrête. Un site avec plus de 50 articles de blog reçoit 33 fois plus de visites de crawlers IA qu’un site sans blog. Pas 10 % de plus. Trente-trois fois plus. La logique est directe : plus vous couvrez de territoire sémantique, plus vous avez de chances d’apparaître dans les sous-requêtes générées par le fan-out.

2.3. La corrélation trafic humain / crawl IA

Une donnée contre-intuitive : les sites qui autorisent le crawl IA reçoivent en moyenne 527,7 sessions humaines contre 164,9 pour les sites qui le bloquent soit 3,2 fois plus de trafic humain. Les IA ne viennent pas chercher des sites faibles pour les propulser. Elles reviennent sur les sites qui attirent déjà une audience humaine réelle.

Sur les sites que je nous gérons pour Vu du Web et Swipple ainsi que pour mon propre écosystème e-commerce (Swiss Ball), j’observe exactement ce phénomène depuis début 2025 : les sites à fort contenu éditorial sont crawlés beaucoup plus fréquemment et génèrent du trafic référent LLM avec des taux de conversion radicalement supérieurs au trafic organique classique. C’est ce qui nous a poussé à créer l’offre AI mention Authority by Vu du Web

3. Ce que le query fan-out doit concrètement changer pour votre stratégie de contenu

3.1. Penser en “clusters de sous-questions” plutôt qu’en mots-clés

Exemple concret. Si vous voulez être cité quand un professionnel demande à ChatGPT “comment améliorer ma visibilité dans les IA génératives ?”, voici ce que l’IA va probablement chercher via son fan-out :

“qu’est-ce que le GEO Generative Engine Optimization ?”
“comment structurer un article pour les AI Overviews ?”
“quels signaux EEAT pour les LLM ?”
“comment être cité par ChatGPT ?”
“différence entre SEO et GEO en 2026”
“meilleurs outils pour mesurer la visibilité dans les LLM”

Si votre site répond clairement à chacune de ces sous-questions dans des articles dédiés, les chances d’être cité dans la réponse finale sont exponentiellement supérieures à un site qui n’aurait qu’un seul article “tout-en-un”.

3.2. La règle des 40 mots et la densité de réponse

Les données Q1 2026 confirment : les blocs de réponse de moins de 40 mots sont extraits 2,7 fois plus souvent par les LLM que les passages plus longs. Dans une logique de fan-out, c’est encore plus critique. L’IA doit aller vite, récupérer plusieurs sources en parallèle, et synthétiser. Si votre réponse à la sous-question n’est pas formulée clairement dans les 150 premiers mots de votre article, vous perdez l’extraction au profit d’une source plus lisible. Ce n’est pas une question de qualité rédactionnelle. C’est une question d’architecture de l’information.

3.3. Le schéma structuré : plus un bonus SEO, une condition d’entrée GEO

L’étude Duda confirme que les sites avec un schéma local complet ont un taux de crawl IA de 82 % contre 55,2 % pour ceux sans schéma. L’étude ConvertMate (80 millions de citations analysées) mesure une amélioration de 67 % de la couverture pour les sites qui implémentent un schéma structuré complet en JSON-LD. Le schema.org n’est plus une optimisation technique accessoire. C’est le passeport pour être identifiable et extractible par les systèmes de fan-out.

3.4. La fraîcheur du contenu comme signal de récupérabilité

Les pages mises à jour dans les deux derniers mois obtiennent 28 % de citations supplémentaires par rapport aux contenus plus anciens (Superlines, Q1 2026). 50 % du contenu cité par les IA a moins de 13 semaines. Dans la logique du fan-out, les sous-requêtes parallèles récupèrent les résultats actuels du moteur. Un contenu ancien peut être déclassé par un concurrent plus récent. La mise à jour régulière de vos contenus piliers n’est plus optionnelle. C’est une hygiène de citabilité.

4. Le paradoxe de la “boîte noire” : ce que ça signifie pour votre stratégie GEO

Todorovic a dit que les modèles d’IA peuvent fonctionner “comme une boîte noire”. Cette déclaration a été sortie de son contexte. La nuance est importante. Il n’est pas en train de dire que Google ne contrôle pas ses IA. Il explique pourquoi le déploiement du machine learning dans Search a été progressif et prudent : contrairement à un système de règles explicites, un modèle ML ne peut pas être débogué ligne par ligne.

Pour nous, professionnels du SEO/GEO, voici ce que ça change :

Les fondamentaux SEO classiques restent la fondation — les AI Overviews s’appuient sur les systèmes de ranking existants. Le SEO technique et l’autorité thématique reste le socle.
On ne peut pas “hacker” le fan-out — L’optimisation est une question de cohérence sémantique sur la durée. Pas de raccourci.
La diversification des signaux devient critique — Votre présence sur des sources tierces (LinkedIn, médias sectoriels, annuaires) est aussi importante que la qualité de votre site.
La mesure de la citabilité est différente du tracking SEO classique — Les outils comme Profound, Semrush AI, SERanking ou Brand Radar (Ahrefs) deviennent indispensables. J’ai analysé en détail les données SERanking sur qui ChatGPT cite vraiment.

5. Ce que je mets en place concrètement (et ce que ça produit)

5.1. Restructuration des clusters thématiques

J’ai arrêté de raisonner en “article vs article”. Je raisonne en “territoire sémantique” : pour chaque sujet central, je cartographie les 15 à 20 sous-questions que le fan-out va générer et je m’assure d’avoir un contenu qui répond précisément à chacune. Sur swiss-ball.fr, ça s’est traduit par une refonte de pages avec des FAQ en JSON-LD systématiques. Résultat observable : une présence dans les réponses Perplexity sur des requêtes longues sur lesquelles on n’était pas positionné en SEO classique.

5.2. Schéma FAQ systématique

Sur tous les articles de fond de ce blog et de vu-du-web.com, j’intègre systématiquement un bloc FAQ en JSON-LD reprenant les sous-questions les plus probables du fan-out. Les questions correspondent aux formulations que je teste dans ChatGPT et Perplexity. Un schéma FAQ bien renseigné génère 3,1 fois plus d’extractions IA qu’un contenu sans structure de questions-réponses explicites (données Q1 2026).

5.3. Révision systématique des introductions

44 % des citations IA viennent du premier tiers d’une page. J’ai révisé toutes mes pages piliers pour que la réponse principale soit formulée clairement dans les 150 premiers mots. Ce n’est pas du journalisme de dépêche c’est une réponse directe avant de développer.

5.4. Présence hors-site renforcée

LinkedIn est devenu le 2ème domaine le plus cité dans les LLM. J’y publie régulièrement des analyses courtes reprenant les angles de mes articles avec des formulations directement extractibles. Ce n’est pas de la duplication, c’est de la distribution stratégique des signaux de citabilité là où les LLM vont chercher.

Pour aller plus loin : Ce que les LLM pensent de votre marque, ce n’est pas vous qui l’écrivez →

Ce que le query fan-out change vraiment

Ce que le query fan-out change, c’est une logique profonde : on passe d’une optimisation de page à une optimisation de territoire.

Être visible dans les IA génératives en 2026, ce n’est pas ranker sur un mot-clé. C’est être la source la plus cohérente, la plus couverte et la plus extractible sur un espace sémantique donné. C’est ce que je construis depuis 2 ans sur mes propres sites et que nous développions sur les projets clients de Vu du Web avant même que le terme “query fan-out” existe.

Le mécanisme a maintenant un nom officiel. Vous savez comment il fonctionne. La question est : est-ce que votre architecture de contenu est prête pour y répondre ?

Pour approfondir la question des signaux hors-site : Mentions et citations : le nouveau backlink à l’ère de l’IA générative →

Pour mesurer votre visibilité actuelle dans les LLM : Visibilité dans les LLM : 7 enseignements du 1er trimestre 2026 →

Sources

Google Search Off the Record — Nikola Todorovic, Director of Software Engineering Google Search, mai 2026
Duda — AI Crawler Study, 858 457 sites, 68,9 millions de visites crawlers IA, février 2026 (via Search Engine Journal, 20 avril 2026)
ConvertMate — AI Visibility Study, 80 millions de citations, 10 000+ domaines, 2026
Superlines — AI Search Statistics 2026, 34 234 réponses IA analysées, mars 2026
Search Engine Journal — “Google’s Black Box AI Models”, mai 2026

Query Fan-Out : le mécanisme caché qui décide si l’IA vous cite