Lexique GEO complet : 50 termes pour maîtriser le référencement IA en 2026

Q: Par quel terme commencer si je suis nouveau en GEO ?

Dans l'ordre : (1) GEO — comprenez l'objectif, (2) RAG — comprenez comment les moteurs sélectionnent leurs sources, (3) Citabilité — comprenez ce qui rend votre contenu citable, (4) PerplexityBot — corrigez les problèmes techniques, (5) Fraîcheur — planifiez vos mises à jour.

Publié par Gaël Renaudin · Expert SEO & GEO · Avril 2026 · Lecture : 18 min

GEO, RAG, LLM, citabilité, query fan-out, chunking, time-decay… Le vocabulaire du référencement IA s'est enrichi à une vitesse vertigineuse depuis 2023. Pour un dirigeant de PME ou un responsable marketing, comprendre ces termes n'est plus optionnel : c'est la condition pour évaluer une stratégie, choisir un prestataire, et ne pas se faire vendre du vent.

Ce lexique ne ressemble pas aux autres. Chaque terme est accompagné de sa définition claire, de son impact concret pour une PME, et d'un conseil actionnable que vous pouvez appliquer cette semaine. Pas de jargon pour faire savant — des définitions que vous pouvez réutiliser en réunion ou dans un brief agence.

50 termes. 50 définitions actionnables. Une ressource à bookmarker et à partager avec votre équipe marketing.

Comment lire ce lexique

Chaque terme est catégorisé avec un badge de couleur pour vous orienter rapidement :

Fondamental Concepts de base indispensables

Technique Optimisations techniques du site

Contenu Stratégie et format éditorial

Mesure Indicateurs et suivi des résultats

Outil Plateformes et crawlers IA

Avancé Concepts techniques approfondis

Ce lexique est maintenu à jour. Les termes sont classés par ordre alphabétique pour une consultation rapide. Utilisez le sommaire pour accéder directement à la lettre qui vous intéresse.

AEO — Answer Engine Optimization

Fondamental

L'AEO désigne l'optimisation du contenu pour être sélectionné comme réponse directe dans les interfaces qui génèrent des réponses sans afficher de liste de liens. Apparu avant le GEO, il ciblait initialement les featured snippets Google et la recherche vocale. En 2026, AEO et GEO se recoupent à environ 80 % selon Onely — la différence principale étant que l'AEO visait une réponse courte et unique (featured snippet), tandis que le GEO cible une synthèse multi-sources par les IA génératives.

Conseil : si vous avez déjà optimisé pour les featured snippets Google, vous avez une base GEO. La structure Q&A que vous avez utilisée est exactement ce que les IA cherchent à extraire.

AI Mode — Mode de recherche IA de Google

Fondamental

AI Mode est la version IA-first du moteur de recherche Google, lancée en 2025. Contrairement aux AI Overviews (un résumé IA en haut des résultats classiques), AI Mode génère une réponse conversationnelle complète comme ChatGPT ou Perplexity. Selon une étude Semrush (2025), 93 % des sessions AI Mode se terminent sans clic vers un site externe — le taux de zero-click le plus élevé de tous les moteurs.

Conseil : AI Mode n'est pas encore disponible en France (avril 2026) mais son déploiement est imminent. Préparez votre contenu dès maintenant avec des réponses directes dans les 100 premiers mots de chaque article.

AI Overviews — Résumés IA de Google

FondamentalMesure

Les AI Overviews (anciennement SGE — Search Generative Experience) sont les résumés générés par l'IA de Google qui apparaissent en haut des résultats de recherche, avant les liens organiques. Ils synthétisent des informations de plusieurs sources avec des citations. En 2026, ils apparaissent sur 25,11 % de toutes les recherches aux États-Unis selon Conductor. Être cité dans un AI Overview augmente le CTR de 35 % par rapport aux résultats non cités sur la même page. Ils ne sont pas encore déployés en France, mais leur arrivée est attendue courant 2026.

Conseil : les pages citées dans les AI Overviews overlappent à 82 % avec les citations Perplexity. Optimisez pour Perplexity maintenant — vous serez prêt dès l'arrivée des AI Overviews en France. Guide complet Perplexity

Autorité thématique — Topical Authority

Contenu

L'autorité thématique mesure la profondeur et la cohérence de votre expertise sur un sujet donné, telle que perçue par les moteurs IA. Contrairement à l'autorité de domaine (qui mesure le volume de backlinks), l'autorité thématique se construit en couvrant un sujet sous tous ses angles de façon exhaustive. Sur Perplexity, l'autorité thématique représente une part bien plus importante du signal de classement que l'autorité de domaine classique (~15 % seulement pour le DA selon theStacc). Un site niche avec une couverture profonde d'un sujet peut surpasser un grand généraliste.

Conseil : ne papillonnez pas entre les sujets. Traitez votre thématique principale en profondeur avec des clusters de contenus interconnectés — c'est ce que les IA perçoivent comme de l'expertise réelle.

Citation IA — AI Citation

FondamentalMesure

Une citation IA est une référence numérotée ([1], [2], [3]...) que Perplexity, ChatGPT Search ou les AI Overviews incluent dans leurs réponses pour attribuer une information à une source spécifique. C'est l'équivalent d'un clic en position 1 pour le GEO : être cité signifie que l'IA a sélectionné votre contenu comme la source la plus fiable pour une réponse précise. Sur Perplexity, chaque réponse contient 3 à 8 citations — sur 20 à 50 pages évaluées. Être en position [1] ou [2] maximise la visibilité et le trafic référé.

Conseil : une citation en position [1] sur Perplexity génère un CTR de 15 à 25 %. Contrairement à Google où le trafic est difficile à tracer depuis les AI Overviews, les citations Perplexity génèrent du trafic traçable dans GA4 sous la source perplexity.ai.

Citabilité — Citeability

Fondamental

La citabilité est la capacité d'un contenu à être perçu comme suffisamment factuel, structuré et fiable pour que l'IA l'utilise comme source explicite dans ses réponses. C'est la métrique centrale du GEO. Un contenu très bien référencé sur Google peut avoir une faible citabilité GEO s'il est trop généraliste, trop vague, ou trop ancien. À l'inverse, un article récent avec des données originales et une structure extractable peut avoir une citabilité excellente même sur un site d'autorité modeste.

Conseil : pour tester votre citabilité sur Perplexity, posez directement la question que votre prospect poserait à une IA. Si vous n'apparaissez pas dans les 3 premières citations, votre contenu manque de structure extractable, de fraîcheur, ou de données originales.

Chunking — Découpage sémantique

Avancé

Le chunking est le processus de découpage d'un long texte en segments sémantiquement cohérents pour le traitement par les LLM. Dans un système RAG, les documents sont découpés en "chunks" (morceaux) de taille optimale — généralement 280 à 320 caractères selon les données de Nicolas Mauhin — pour être indexés dans une base vectorielle et récupérés individuellement lors d'une requête. Le chunking explique pourquoi Perplexity cite des passages précis plutôt que des pages entières.

Conseil : écrivez chaque section de vos articles comme si elle devait avoir une valeur autonome. Si un paragraphe extrait de son contexte ne se comprend pas seul, réécrivez-le.

ClaudeBot — Crawler d'Anthropic

TechniqueOutil

ClaudeBot (aussi appelé Claude-Web) est le robot d'indexation web d'Anthropic, l'entreprise derrière le modèle IA Claude. Il crawle le web pour alimenter les fonctions de recherche de Claude et potentiellement ses données d'entraînement. Comme GPTBot et PerplexityBot, il respecte les directives robots.txt. Ne pas l'autoriser explicitement dans votre robots.txt peut réduire votre visibilité sur Claude, qui est de plus en plus utilisé comme source par d'autres outils IA.

Conseil : ajoutez User-agent: Claude-Web / Allow: / dans votre robots.txt pour autoriser explicitement l'indexation par Claude.

Cocon sémantique — Topic Cluster / Semantic Silo

Contenu

Le cocon sémantique est une architecture de contenu qui organise les pages d'un site en clusters thématiques interconnectés : une page pilier traite le sujet principal, entourée de pages satellites qui approfondissent chaque sous-sujet. Pour le GEO, le cocon sémantique est doublement précieux : il construit l'autorité thématique que les LLM perçoivent comme signal d'expertise, et il augmente les chances qu'au moins une page du cluster réponde exactement à la question posée à l'IA — avec le bon niveau de granularité.

Conseil : pour chaque pilier de votre activité, ciblez 5 à 10 articles satellites qui approfondissent les sous-sujets. Les IA citent souvent les articles satellites (plus précis) plutôt que la page pilier (trop générale) pour des requêtes spécifiques.

Découplage trafic/visibilité — Traffic/Visibility Decoupling

Mesure

Le découplage désigne le phénomène où la visibilité d'une marque dans les résultats IA (AI Overviews, ChatGPT, Perplexity) se maintient ou augmente, alors que le trafic vers le site baisse car les utilisateurs obtiennent la réponse directement dans l'interface IA sans cliquer. Selon WebRankInfo, c'est l'une des nouvelles réalités du GEO : une entreprise peut avoir une citabilité IA excellente et voir son trafic GA4 stagner ou baisser. Le découplage inverse la logique traditionnelle où trafic = succès.

Conseil : si vos leads entrants restent stables mais que votre trafic baisse, vous êtes peut-être dans un découplage positif. Complétez votre suivi GA4 avec un monitoring de vos citations IA pour mesurer votre visibilité réelle.

Données structurées — Structured Data / Schema Markup

Technique

Les données structurées sont des balises HTML (généralement en format JSON-LD) qui décrivent le contenu d'une page dans un langage directement compréhensible par les moteurs de recherche et les crawlers IA. Elles indiquent à Google, Perplexity et GPTBot ce qu'est votre contenu (un article, une FAQ, un service, une personne...) et ses attributs clés (auteur, date, localisation...). Selon les directives publisher de Perplexity (février 2026), l'implémentation de Schema.org augmente le poids de citation d'environ 23 %.

Conseil : les balises prioritaires pour le GEO sont, dans l'ordre : Article + dateModified, FAQPage, Person (auteur), Organization, LocalBusiness. Validez toujours vos balises sur Google Rich Results Test.

E-E-A-T — Experience, Expertise, Authoritativeness, Trustworthiness

Fondamental

E-E-A-T est le cadre qualité de Google pour évaluer la crédibilité d'un contenu selon quatre dimensions : Expérience (l'auteur a-t-il vécu ce dont il parle ?), Expertise (maîtrise-t-il le sujet ?), Autorité (est-il reconnu comme référence dans son domaine ?), et Fiabilité (ses informations sont-elles exactes et vérifiables ?). Ce cadre, initialement SEO, est également au cœur des critères de sélection des LLM. Les modèles IA comme ChatGPT et Gemini ont appris à reconnaître les mêmes signaux d'expertise que Google : auteur identifié, sources citées, données vérifiables, cohérence entre plateformes.

Conseil : pour renforcer votre E-E-A-T GEO, assurez-vous que chaque article a un auteur identifié avec biographie, que vos affirmations sont sourcées avec des liens, et que votre expertise est cohérente sur votre site, LinkedIn et Google Business.

Embeddings — Représentations vectorielles

Avancé

Les embeddings sont des représentations mathématiques (vecteurs) des mots, phrases ou documents dans un espace à plusieurs dimensions. Ils permettent aux LLM de mesurer la proximité sémantique entre des concepts — comprendre que "voiture" et "automobile" sont proches, ou que "référencement IA" et "GEO" traitent du même sujet. Dans les systèmes RAG, le contenu est converti en embeddings pour être comparé aux embeddings de la requête de l'utilisateur. Plus votre contenu est sémantiquement proche de la requête, plus il a de chances d'être récupéré.

Conseil : utilisez le vocabulaire que vos prospects utilisent réellement — pas celui que vous utilisez en interne. Les termes clients et les synonymes naturels améliorent votre proximité vectorielle avec les requêtes IA.

Entité — Entity (Knowledge Graph)

Avancé

Une entité est un concept réel et unique reconnu par les moteurs de recherche et les LLM : une personne, une entreprise, un lieu, un produit, un événement. Les entités sont liées entre elles dans des bases de connaissances comme le Knowledge Graph de Google. Pour le GEO, être reconnu comme une entité distincte (par opposition à du texte générique) augmente considérablement la citabilité. Être mentionné cohéremment sur de nombreuses sources avec le même nom et les mêmes attributs ancre votre identité d'entité dans les données d'entraînement des LLM.

Conseil : utilisez toujours exactement le même nom d'entreprise sur toutes les plateformes. Les variations (SARL vs. SAS, avec ou sans tiret, abréviation...) affaiblissent votre identité d'entité et fragmentent votre citabilité IA.

FAQPage Schema — Balisage FAQ structuré

Technique

FAQPage est un type de données structurées Schema.org qui balisé les sections question-réponse d'une page web. C'est l'une des balises les plus efficaces pour le GEO car elle reproduit exactement le format que les LLM utilisent pour générer leurs réponses. Une FAQ balisée FAQPage est directement mappée aux requêtes conversationnelles des utilisateurs IA. De plus, FAQPage est éligible aux rich results Google — une double optimisation SEO et GEO avec une seule action.

Conseil : ajoutez une section FAQ de 4 à 6 questions à chaque page de service et article de blog. Rédigez les questions exactement comme vos prospects les poseraient à une IA. Baliser en JSON-LD dans le head de la page.

Fenêtre de contexte — Context Window

Avancé

La fenêtre de contexte est la quantité maximale de texte (mesurée en tokens) qu'un LLM peut traiter en une seule interaction. Claude 3.5 Sonnet gère jusqu'à 200 000 tokens, GPT-4 Turbo jusqu'à 128 000 tokens. Pour le GEO, cela signifie que les LLM peuvent lire des documents très longs — mais que le contenu placé en début de document (premier 30 %) est statistiquement plus souvent extrait que le contenu en fin. C'est pourquoi répondre directement dans l'introduction est crucial.

Conseil : 44,2 % de toutes les citations LLM proviennent des 30 premiers pourcents du texte selon Position Digital. Ne construisez pas votre argumentation progressivement — donnez la réponse directe dès le premier paragraphe.

Fraîcheur du contenu — Content Freshness

Contenu

La fraîcheur désigne le signal envoyé aux moteurs IA par la date de publication ou de mise à jour d'un contenu. C'est le facteur différenciant le plus fort sur Perplexity, qui applique un mécanisme de time-decay agressif : 50 % des citations Perplexity proviennent de contenu publié en 2025 selon Seer Interactive. Les pages mises à jour dans les 30 derniers jours bénéficient du tier de fraîcheur le plus fort. Au-delà de 90 jours sans mise à jour, le signal de fraîcheur est proche de zéro sur Perplexity.

Conseil : planifiez une révision de vos 5 articles les plus stratégiques tous les 60 jours. Ajoutez la mention "Mis à jour le XX/XX/XXXX" visible sur la page et balisez la propriété dateModified dans votre JSON-LD Article.

GEO — Generative Engine Optimization

Fondamental

Le GEO est l'ensemble des techniques qui permettent à une entreprise d'être citée comme source de référence dans les réponses générées par les moteurs IA — ChatGPT, Gemini, Perplexity, Claude, AI Overviews. Terme formellement défini en novembre 2023 par des chercheurs de l'Université de Princeton (arXiv 2311.09735), il s'est depuis imposé comme la discipline dominante du référencement IA. Contrairement au SEO qui vise un classement dans une liste de liens, le GEO vise une recommandation directe dans une réponse synthétisée — avec un niveau de confiance prospect nettement supérieur.

Conseil : le GEO ne remplace pas le SEO — il s'y appuie. Un site techniquement solide en SEO a une base GEO directement utilisable. Commencez par auditer votre citabilité actuelle en testant 4 prompts sur ChatGPT, Perplexity et Gemini.

GPTBot — Crawler OpenAI / ChatGPT

TechniqueOutil

GPTBot est le robot d'indexation web d'OpenAI, utilisé pour alimenter les fonctions de recherche de ChatGPT et potentiellement les données d'entraînement des prochains modèles GPT. Contrairement à PerplexityBot (qui crawle en temps réel à chaque requête), GPTBot constitue un index utilisé pour les mises à jour périodiques du modèle. Si votre site bloque GPTBot via robots.txt, votre contenu ne sera pas intégré lors des prochains cycles d'entraînement ou de mise à jour de ChatGPT.

Conseil : vérifiez votre robots.txt et ajoutez explicitement User-agent: GPTBot / Allow: /. Testez ensuite l'accessibilité en cherchant votre domaine sur ChatGPT Search pour vérifier qu'il peut accéder à votre contenu.

Grounding — Ancrage factuel

Avancé

Le grounding est le processus par lequel un LLM ancre ses réponses à des sources vérifiables plutôt que de générer du texte basé uniquement sur ses paramètres internes. Un système bien "groundé" cite ses sources, montre d'où vient l'information, et réduit les hallucinations. Pour le GEO, comprendre le grounding est clé : votre contenu est sélectionné comme source de grounding quand il répond directement, précisément et factuellement à la question posée. Le grounding est la raison pour laquelle les données sourcées et vérifiables sont plus souvent citées que les opinions non étayées.

Conseil : chaque statistique, chaque affirmation factuelle dans vos articles doit être accompagnée d'un lien vers la source originale. Cela renforce à la fois votre crédibilité GEO et votre E-E-A-T Google.

Hallucination — AI Hallucination

Fondamental

Une hallucination est une information générée par un LLM qui est factuellelement incorrecte mais présentée avec confiance comme si elle était vraie. Pour le GEO, les hallucinations peuvent affecter directement votre entreprise : un LLM peut mentionner votre nom avec de fausses informations (mauvaise adresse, services inexistants, prix erronés). La solution est de maximiser la cohérence et l'abondance des informations correctes disponibles sur le web — les LLM "hallucinent" moins sur les sujets bien documentés et cohérents entre plusieurs sources.

Conseil : testez régulièrement ce que les IA disent de votre entreprise avec le prompt "[nom de votre entreprise] est-elle une référence dans [votre domaine] ?". Corrigez les informations incorrectes en uniformisant vos données sur toutes vos plateformes.

Indexation IA — AI Indexing

Technique

L'indexation IA est le processus par lequel les crawlers IA (GPTBot, PerplexityBot, ClaudeBot) découvrent, lisent et stockent votre contenu pour le rendre disponible lors des requêtes. Elle diffère de l'indexation Google sur un point clé : les crawlers IA lisent le contenu pour en extraire la sémantique et les entités, pas seulement pour analyser les liens et les mots-clés. Un contenu bien indexé par l'IA est structuré, factuel, lisible en HTML (pas en JavaScript côté client), et accessible sans authentification.

Conseil : vérifiez que votre contenu est présent dans le HTML source de vos pages (clic droit → Afficher la source). Si votre texte n'y apparaît pas, votre site utilise du rendu JavaScript côté client — les crawlers IA ne peuvent pas le lire.

Mesure

L'Intent Share est une métrique GEO qui mesure si votre contenu est sélectionné par les moteurs IA pour satisfaire une intention utilisateur spécifique (informationnelle, commerciale, transactionnelle). Elle remplace la notion de "part de marché sur un mot-clé" du SEO classique par une notion plus nuancée : êtes-vous la source que l'IA choisit quand un utilisateur cherche à résoudre le problème X que vous résolvez ? L'Intent Share se mesure en testant les requêtes à haute valeur de votre secteur sur les différents moteurs IA.

Conseil : listez les 10 questions que vous recevez le plus souvent de vos clients. Testez-les une par une sur Perplexity. Votre Intent Share est le ratio de questions où vous apparaissez en citation sur le total testé.

JSON-LD — JavaScript Object Notation for Linked Data

Technique

JSON-LD est le format de code recommandé par Google et privilégié par les LLM pour implémenter les données structurées Schema.org. Il s'intègre dans le <head> de vos pages HTML sous forme de balise <script type="application/ld+json"> sans affecter l'affichage visuel de la page. C'est le format le plus propre et le plus facile à maintenir pour les non-développeurs car il est séparé du HTML visible. Tous les crawlers IA majeurs le lisent nativement.

Conseil : sur WordPress, Yoast SEO et Rank Math génèrent automatiquement du JSON-LD de base (Article, Organization, BreadcrumbList). Vérifiez qu'ils sont activés et enrichissez-les manuellement avec dateModified et Person pour le GEO.

Knowledge Graph — Graphe de connaissances

Avancé

Le Knowledge Graph (ou graphe de connaissances) est une base de données relationnelle structurée sous forme de graphe, où chaque entité (personne, entreprise, lieu, concept) est reliée à d'autres entités par des relations typées. Google maintient un immense Knowledge Graph qui alimente ses Panels de connaissances, et les LLM en ont assimilé une version lors de leur entraînement. Être présent dans le Knowledge Graph de Google — notamment via une fiche Wikipedia, une fiche Google Business complète, ou un balisage Organization Schema.org riche — augmente significativement votre citabilité GEO.

Conseil : si votre entreprise est suffisamment notable, envisagez de créer une page Wikipedia factuelle sur votre secteur d'activité (pas sur votre entreprise directement — c'est contraire aux règles), en y intégrant une mention légitime de votre entreprise comme référence.

LLM — Large Language Model

Fondamental

Un LLM (Grand Modèle de Langage) est un modèle d'intelligence artificielle entraîné sur de très grandes quantités de texte pour comprendre, générer et résumer du langage humain. GPT-4/GPT-4o (OpenAI/ChatGPT), Gemini (Google), Claude (Anthropic), LLaMA (Meta) et Mistral sont les principaux LLM en 2026. Ils sont au cœur des moteurs IA que cible le GEO. Les LLM fonctionnent par prédiction statistique : ils génèrent la suite de mots la plus probable en fonction de leur entraînement et du contexte fourni.

Conseil : les différents LLM ont des comportements de citation différents. Gemini favorise les contenus de marque directe (52 % de ses citations viennent de domaines de marque), Perplexity favorise la fraîcheur et la diversité de sources. Adaptez votre stratégie à chaque moteur.

LLMO — Large Language Model Optimization

Fondamental

Le LLMO est une discipline cousine du GEO, apparue des praticiens du marketing (vs. GEO qui vient de la recherche académique). Elle se concentre spécifiquement sur l'optimisation pour les LLM comme GPT, Claude et Gemini — par opposition au GEO qui couvre tous les moteurs génératifs y compris Perplexity. Selon Onely, GEO et LLMO partagent environ 80 % de leurs tactiques. La distinction est principalement académique. Dans la pratique française, les deux termes sont utilisés de façon interchangeable.

Conseil : ne vous perdez pas dans la guerre des acronymes (GEO, LLMO, AEO, AIO, LLMO...). Ce qui compte, c'est l'action : structurer votre contenu pour qu'il soit cité par les IA. Choisissez un terme pour votre communication et restez-y cohérent.

llms.txt — Fichier d'instructions pour les LLM

Technique

Le fichier llms.txt est un fichier Markdown placé à la racine d'un site web (monsite.fr/llms.txt) qui fournit aux crawlers IA une description structurée du contenu du site, de l'expertise de l'auteur, et des pages les plus importantes. Proposé par Jeremy Howard (fast.ai) en septembre 2024, il est souvent décrit comme le "robots.txt des LLM". En avril 2026, son impact est encore expérimental — les crawlers IA ne le consultent pas de façon systématique. Mais son adoption accélère (950+ domaines, 30 000+ installations WordPress), et les pionniers auront un avantage quand les IA commenceront à l'exploiter activement.

Conseil : sur WordPress, installez le plugin "Website LLMs.txt" (installation en 1 clic, 30 000+ installations). Pour les autres CMS, créez manuellement le fichier. L'effort est minimal et l'avantage compétitif potentiel est réel à horizon 12-18 mois.

Maillage interne GEO — Internal Linking for GEO

ContenuTechnique

Le maillage interne GEO est l'organisation des liens internes entre vos pages selon une logique sémantique et thématique plutôt que simplement navigationnelle. Pour les LLM, le maillage interne aide à comprendre les relations entre vos contenus et renforce l'autorité thématique d'un cluster. Un crawler IA qui suit les liens internes de votre site doit percevoir une cohérence : vos articles sur le GEO pointent vers vos services GEO, qui pointent vers des études de cas, qui pointent vers votre page de contact. Cette cohérence renforce la perception d'expertise intégrée.

Conseil : chaque nouvel article doit pointer vers au moins 2 articles existants (liens sortants) et être ajouté en lien dans au moins 2 articles existants (liens entrants). Le maillage interne est l'un des rares leviers GEO qui améliore simultanément le SEO classique, la citabilité IA et l'expérience utilisateur.

Moteur de réponse — Answer Engine

Fondamental

Un moteur de réponse est un système de recherche qui génère directement une réponse synthétisée à la question de l'utilisateur, au lieu d'afficher une liste de liens à cliquer. Perplexity se définit explicitement comme un "answer engine". ChatGPT, Gemini et les AI Overviews Google fonctionnent sur le même principe. Ce paradigme — passer de "chercher" à "recevoir une réponse" — est la transformation fondamentale qui justifie l'existence du GEO comme discipline distincte du SEO.

Conseil : adoptez la posture d'écriture d'un moteur de réponse pour tester votre contenu. Demandez-vous : si je suis l'IA et que je dois générer une réponse de 3 lignes sur ce sujet pour un utilisateur, est-ce que mon article contient exactement ce dont j'ai besoin ? Si non, réécrivez-le.

Passage extractable — Extractable Passage

Contenu

Un passage extractable est un segment de texte (paragraphe, liste, définition) qui répond seul à une question précise et peut être extrait de son contexte sans perdre son sens. C'est l'unité fondamentale du GEO — ce que les LLM cherchent à identifier et citer dans vos articles. La longueur optimale d'un passage extractable est de 280 à 320 caractères selon les études sur les comportements de citation IA. Un passage extractable commence par l'information principale, est écrit à la voix active, et ne contient pas de références à d'autres parties du texte ("comme mentionné ci-dessus", "voir section suivante").

Conseil : après avoir rédigé un article, lisez chaque paragraphe en isolation. Si vous ne comprenez pas son sens hors contexte, il n'est pas extractable. Réécrivez jusqu'à ce que chaque paragraphe soit autonome.

PerplexityBot — Crawler de Perplexity AI

TechniqueOutil

PerplexityBot est le crawler de Perplexity AI qui indexe le web en temps réel. Contrairement à GPTBot (qui constitue un index statique), PerplexityBot effectue des requêtes pour chaque question posée par les utilisateurs, en combinaison avec les API de recherche Bing et Google. Il respecte les directives robots.txt : si votre site le bloque, votre contenu est invisible sur Perplexity. Selon la documentation officielle de Perplexity, il peut toujours indexer le domaine, le titre et un résumé factuel minimal même si la page est bloquée — mais pas le contenu complet.

Conseil : vérifiez votre fichier robots.txt sur votresite.fr/robots.txt. Si PerplexityBot n'est pas explicitement autorisé, ajoutez : User-agent: PerplexityBot / Allow: /. Si vous utilisez Cloudflare ou un WAF, ajoutez les IP officielles de Perplexity à votre liste blanche.

Prompt — Requête conversationnelle

Fondamental

Un prompt est une instruction ou une question donnée à un modèle IA pour obtenir une réponse. Pour le GEO, les prompts sont l'équivalent des mots-clés en SEO : ce sont les questions que vos prospects posent aux IA et pour lesquelles vous voulez être cité. Contrairement aux mots-clés SEO (courts, souvent fragmentés), les prompts IA sont conversationnels, longs, et décrivent un besoin complet : "Quelle est la meilleure agence GEO à Paris pour une PME dans le bâtiment ?" plutôt que "agence GEO Paris".

Conseil : identifiez 10 à 20 prompts à fort impact pour votre activité — ce sont les questions que vos prospects posent exactement à une IA. Testez-les chaque semaine sur Perplexity, ChatGPT et Gemini. Ce sont vos "mots-clés GEO" à surveiller.

Publishers Program (Perplexity) — Programme éditeurs

Outil

Le Perplexity Publishers Program est un programme de partage de revenus entre Perplexity et les éditeurs dont le contenu est cité dans ses réponses. Lancé en 2025 et étendu en 2026 via "Comet Plus", il reverserait 80 % des revenus d'abonnement aux éditeurs partenaires. Les participants rapportent un revenu supplémentaire proportionnel à leur fréquence de citation. Le programme fournit aussi des analytics sur les performances de citation — une donnée précieuse pour le GEO.

Conseil : pour les PME, rejoindre le Publishers Program reste difficile — il cible principalement les grands éditeurs. Mais suivre son évolution est utile : les pratiques qu'il récompense (contenu récent, bien structuré, citable) sont exactement celles que vous devez développer de toute façon.

Query Fan-Out — Décomposition de requête

Avancé

Le query fan-out est le processus par lequel un LLM décompose une requête complexe en plusieurs sous-requêtes de recherche simples pour construire une réponse complète. Quand un utilisateur demande "quelle est la meilleure stratégie de référencement IA pour une PME en 2026 ?", le moteur peut générer 3 à 5 sous-requêtes : "GEO définition PME", "coût référencement IA France", "résultats GEO PME cas client"... Chacune de ces sous-requêtes est une opportunité de citation indépendante pour votre contenu.

Conseil : sur ChatGPT Search et Perplexity, vous pouvez voir les sous-requêtes générées en temps réel. Observez les fan-outs sur vos requêtes cibles — chaque sous-requête est un sujet d'article potentiel qui augmente votre couverture de citation.

RAG — Retrieval-Augmented Generation

Fondamental

Le RAG (Génération Augmentée par Récupération) est la technologie centrale de Perplexity, ChatGPT Search et des AI Overviews. Elle combine deux étapes : (1) récupérer (retrieve) des informations pertinentes depuis une base de données ou le web en temps réel, (2) générer (generate) une réponse cohérente en combinant ces informations avec les connaissances du LLM. Comprendre le RAG est essentiel pour le GEO : c'est précisément lors de l'étape de récupération que votre contenu doit être sélectionné. Un contenu bien structuré, extractable et récent a une meilleure probabilité d'être récupéré par les systèmes RAG.

Conseil : pensez votre contenu comme une base de données de réponses, pas comme un essai littéraire. Chaque paragraphe doit pouvoir être "récupéré" par un système RAG pour répondre à une question précise de façon autonome.

Recherche conversationnelle — Conversational Search

Fondamental

La recherche conversationnelle est le mode d'interaction où l'utilisateur pose des questions en langage naturel, complexes et contextuelles, à un assistant IA — plutôt que de taper des mots-clés fragmentés dans une barre de recherche. Selon les données de marché, les requêtes adressées aux IA sont en moyenne deux fois plus longues que les requêtes Google classiques. Ce changement de format nécessite un changement de stratégie de contenu : vos articles doivent répondre à des questions complètes, pas optimiser pour des fragments de mots-clés.

Conseil : réécrivez vos titres H2 et H3 en questions complètes. "Comment choisir son agence SEO ?" plutôt que "Choix agence SEO". Cette seule modification améliore votre alignement avec les requêtes conversationnelles des IA.

robots.txt (pour les IA) — AI Crawler Directives

Technique

Le fichier robots.txt est un fichier texte placé à la racine d'un site web qui donne des instructions aux robots d'indexation (crawlers) sur les pages qu'ils peuvent ou ne peuvent pas accéder. En 2026, les crawlers IA majeurs — GPTBot (OpenAI), PerplexityBot (Perplexity), ClaudeBot (Anthropic), CCBot (Common Crawl) — respectent les directives robots.txt. Bloquer un de ces crawlers par erreur ou intentionnellement rend votre contenu invisible sur le moteur IA correspondant.

Conseil : vérifiez votre robots.txt maintenant sur votresite.fr/robots.txt. Cherchez des directives Disallow: / associées à des User-agents IA. Si vous en trouvez, supprimez-les ou ajoutez des Allow explicites pour chaque crawler IA que vous voulez autoriser.

Schema.org — Standard de données structurées

Technique

Schema.org est un vocabulaire standardisé de données structurées créé en 2011 par Google, Microsoft, Yahoo et Yandex. Il permet de baliser le contenu web pour le rendre directement compréhensible par les moteurs de recherche et les crawlers IA sans interprétation approximative. En 2026, l'implémentation de Schema.org est l'une des optimisations techniques les plus efficaces pour le GEO : elle augmente le poids de citation dans Perplexity d'environ 23 % selon les directives publisher de Perplexity (février 2026). Les types les plus utiles pour le GEO : Article, FAQPage, Person, Organization, LocalBusiness, HowTo.

Conseil : commencez par le minimum viable GEO Schema.org : Article + dateModified + Person (auteur) sur tous vos articles. Ajoutez FAQPage sur vos pages avec des sections Q&A. Validez tout sur validator.schema.org.

Mesure

Le Share of Voice IA est la métrique centrale du GEO. Elle mesure la fréquence à laquelle votre marque est citée dans les réponses des moteurs IA par rapport à vos concurrents, sur un ensemble de requêtes cibles. C'est l'équivalent de la "part de marché organique" du SEO classique, appliquée à l'écosystème IA. Des outils comme Otterly.ai (à partir de 29 €/mois) ou Profound (99 $/mois) permettent de monitorer automatiquement ce Share of Voice IA.

Conseil : construisez votre propre suivi de Share of Voice IA dans un Google Sheet avant d'investir dans un outil payant. Testez les mêmes 10-20 prompts chaque semaine sur Perplexity, ChatGPT et Gemini. Notez qui est cité. Ce tableau de bord manuel sera votre ligne de base.

Source citable — Citable Source

Contenu

Une source citable est un contenu structuré et factuel qui présente toutes les caractéristiques qui incitent un LLM à le sélectionner comme référence dans ses réponses : données originales, auteur identifié, affirmations sourcées, structure extractable (titres Q&A, listes, définitions claires), fraîcheur, et cohérence avec d'autres sources sur le même sujet. Le contenu "citable" est l'opposé du contenu générique qui répète ce que tout le monde dit — les LLM résument le générique mais citent l'original.

Conseil : pour chaque article, demandez-vous : "quelle est la donnée ou perspective unique que je peux apporter ici que personne d'autre ne dit ?" Cette donnée unique est votre crochet de citabilité. Sans elle, vous serez résumé, pas cité.

Time-Decay — Décroissance temporelle de pertinence

Contenu

Le time-decay est le mécanisme par lequel Perplexity (et dans une moindre mesure les autres moteurs IA) réduit progressivement la probabilité de citation d'un contenu au fil du temps depuis sa publication ou sa dernière mise à jour. Selon les données de SearchAtlas, les pages mises à jour dans les 30 derniers jours bénéficient du tier de fraîcheur le plus fort ; les pages de 60 à 90 jours sans mise à jour perdent significativement ; au-delà de 90 jours, le signal de fraîcheur est proche de zéro. Ce mécanisme est bien plus agressif que l'algorithme de fraîcheur Google.

Conseil : créez un calendrier de révision trimestrielle pour vos articles stratégiques. Une "mise à jour" efficace pour Perplexity inclut : nouvelles données 2026, exemples actualisés, section datée visible sur la page, et propriété dateModified mise à jour dans le JSON-LD.

Token — Unité de traitement du texte

Avancé

Un token est l'unité de base de traitement du texte par un LLM. En anglais, 1 token correspond approximativement à 4 caractères ou ¾ de mot. En français, les mots sont légèrement plus longs, donc on estime 1 token pour environ 3 à 4 caractères. Les limites de fenêtre de contexte sont mesurées en tokens (GPT-4 Turbo : 128 000 tokens ≈ ~100 000 mots en français). Pour le GEO, la notion de token est utile pour comprendre pourquoi les introductions concises et directes sont plus souvent extraites : elles sont traités en priorité dans la fenêtre de contexte.

Conseil : visez des introductions d'articles de 100 à 150 mots max (≈ 150-200 tokens). Ce premier chunk doit contenir la réponse directe à la question principale. Le reste de l'article développe et preuves.

Topical Authority — Voir : Autorité thématique

Contenu

→ Voir terme #04 (Autorité thématique). La topical authority est le terme anglais couramment utilisé dans les discussions GEO francophones. Sur Perplexity, l'autorité thématique compte pour ~85 % du signal de classement (vs. ~15 % pour le DA classique). Un site qui couvre exhaustivement un sujet précis sera perçu comme plus autoritaire qu'un généraliste qui l'effleure, même si son Domain Authority Google est plus faible.

Conseil : construisez votre topical authority en publiant tous les articles de votre cocon sémantique avant de vous disperser sur d'autres sujets. 10 articles interconnectés sur le GEO valent mieux que 30 articles éparpillés sur le SEO, le GEO, le social media et l'emailing.

Trafic IA — AI Referral Traffic

Mesure

Le trafic IA est l'ensemble des visites générées sur votre site par des clics sur des citations dans les moteurs IA (Perplexity, ChatGPT Search, AI Overviews, etc.). Ce trafic est traçable dans Google Analytics 4 pour Perplexity (source : perplexity.ai) et les AI Overviews Google (source : google / medium : organic). Il est qualitativement supérieur au trafic organique classique : les visiteurs IA arrivent après avoir reçu une recommandation explicite de l'IA sur un sujet, ils ont un taux de conversion et un temps de session plus élevés. Le trafic IA total a augmenté de 357 % en un an selon Similarweb (juin 2025).

Conseil : créez un segment GA4 spécifique au trafic Perplexity (source contains "perplexity"). Comparez la durée de session et le taux de conversion de ces visiteurs vs. votre trafic Google organique. La différence de qualité justifiera votre investissement GEO.

Transformer — Architecture des LLM modernes

Avancé

Le Transformer est l'architecture de réseau de neurones qui constitue la fondation technique de tous les LLM modernes (GPT, Gemini, Claude, LLaMA...). Inventée en 2017 dans le papier fondateur "Attention Is All You Need" par Vaswani et al. chez Google, elle permet aux IA de comprendre les relations complexes entre les mots dans un texte grâce à un mécanisme d'"attention" — en pondérant l'importance relative de chaque mot par rapport aux autres dans une séquence. Pour le GEO, comprendre que les LLM traitent les relations sémantiques (pas juste les mots-clés) explique pourquoi la structure narrative et la cohérence thématique comptent autant que les mots-clés exacts.

Conseil : pas besoin de comprendre le Transformer en détail pour le GEO. Retenir le principe suffit : les IA comprennent le sens et le contexte, pas juste les mots. Écrivez pour des humains, pas pour des robots — c'est exactement ce que les Transformers ont rendu possible.

Unlinked Citation — Mention non liée

Avancé

Une unlinked citation est une mention du nom de votre marque ou de votre entreprise sur une source externe sans lien hypertexte vers votre site. En SEO classique, ces mentions ont peu de valeur (seuls les liens comptent). En GEO, elles ont une valeur significative : les LLM ont appris des associations entre entités et thèmes à partir du texte brut des pages web — qu'il y ait un lien ou non. Être mentionné dans une discussion Reddit, un article de blog, ou une transcription de podcast renforce votre identité d'entité et votre autorité thématique dans les données d'entraînement des LLM.

Conseil : participez activement aux discussions de votre secteur sur Reddit, Quora, les forums spécialisés, et LinkedIn. Ces mentions non liées construisent votre présence dans le corpus que les LLM utilisent pour former leurs associations d'entités.

Visibilité IA — AI Visibility / LLM Visibility

Mesure

La visibilité IA est la mesure globale de la présence d'une marque dans les réponses des moteurs IA — fréquence de citation, qualité des mentions (positive, neutre, négative), exactitude des informations rapportées, et couverture thématique (sur quels sujets votre marque apparaît-elle ?). Contrairement à la visibilité Google (mesurable via Search Console), la visibilité IA ne dispose pas encore d'un outil officiel équivalent. Elle se mesure par monitoring manuel ou via des outils tiers comme Otterly.ai, Profound, ou BrandMentions.

Conseil : évaluez votre visibilité IA de départ dès maintenant, avant toute optimisation. Testez 15 prompts représentatifs de votre activité sur 3 moteurs IA. Documentez les résultats. Ce sera votre ligne de base contre laquelle mesurer vos progrès dans 3 mois.

Voice Search — Recherche vocale

Fondamental

La recherche vocale est le mode de requête où l'utilisateur parle à un assistant IA (Siri, Google Assistant, Alexa, ou directement ChatGPT en mode vocal) plutôt que de taper. Les requêtes vocales sont encore plus conversationnelles et longues que les requêtes textuelles IA. En 2026, la recherche vocale représente 20 % des requêtes selon les données de marché. Les optimisations GEO — réponses directes, structure Q&A, langage naturel — bénéficient également à la visibilité en recherche vocale, car les assistants vocaux utilisent les mêmes moteurs IA pour construire leurs réponses.

Conseil : testez votre contenu en lisant vos articles à voix haute. Si ça semble naturel et répond clairement à une question, c'est probablement bien optimisé pour la recherche vocale et le GEO simultanément.

Zero-Click Search — Recherche sans clic

Fondamental

Une recherche zero-click est une session de recherche où l'utilisateur obtient sa réponse directement dans l'interface du moteur IA (ou la SERP Google enrichie) sans cliquer sur aucun lien. En 2026, plus de 60 % des recherches Google aboutissent à un zero-click selon SparkToro. Sur ChatGPT et Gemini (sans web search activé), 100 % des sessions sont zero-click par définition. Le zero-click est la raison fondamentale pour laquelle le trafic organique peut baisser même quand la visibilité IA est bonne — le "découplage trafic/visibilité" (terme #10).

Conseil : ne cherchez pas à éliminer le zero-click — c'est impossible. Cherchez plutôt à être la source citée dans cette réponse zero-click. Même sans clic, votre marque est associée à la réponse correcte dans l'esprit du prospect. C'est du branding de haute valeur.

Demander mon audit GEO gratuit

Réponse sous 48h garantie

FAQ — Questions fréquentes sur le lexique GEO

Quelle est la différence entre GEO, AEO, LLMO et AI SEO ?

Ces quatre termes désignent des variations d'une même pratique. Le GEO (formalisé par Princeton en 2023) couvre tous les moteurs génératifs. Le LLMO (d'origine praticienne) se concentre spécifiquement sur les LLM. L'AEO ciblait initialement les featured snippets et la recherche vocale avant d'être absorbé dans le GEO. L'AI SEO est le terme parapluie qui englobe les trois. Selon Onely, GEO et LLMO partagent ~80 % de leurs tactiques. Ne vous perdez pas dans la sémantique — concentrez-vous sur les actions.

Le GEO va-t-il remplacer le SEO dans les prochaines années ?

Non — le GEO s'appuie sur le SEO, il ne le remplace pas. Les signaux que les LLM utilisent pour évaluer la crédibilité d'une source (autorité de domaine, qualité du contenu, structure technique) sont largement les mêmes que Google. Un bon SEO est la fondation du GEO. La différence est dans l'objectif final : le SEO vise un classement dans une liste de liens, le GEO vise une recommandation directe dans une réponse synthétisée. Les deux sont nécessaires en 2026.

Par quel terme commencer si je suis complètement nouveau en GEO ?

Dans l'ordre de priorité : (1) GEO — comprenez ce que vous optimisez et pourquoi, (2) RAG — comprenez comment les moteurs IA sélectionnent leurs sources, (3) Citabilité — comprenez ce qui rend votre contenu citable ou non, (4) PerplexityBot — corrigez les problèmes techniques qui vous rendent invisible, (5) Fraîcheur du contenu — comprenez le time-decay et planifiez vos mises à jour. Ces 5 termes couvrent 80 % des décisions pratiques que vous aurez à prendre.

Ce lexique est-il mis à jour régulièrement ?

Oui. Le GEO est une discipline en évolution rapide — de nouveaux termes émergent chaque trimestre. Ce lexique est mis à jour au minimum tous les 3 mois pour intégrer les nouvelles pratiques, les nouveaux outils, et les évolutions des algorithmes IA. La date de dernière mise à jour est indiquée en haut de la page. Si vous trouvez un terme manquant ou une définition obsolète, contactez-nous — c'est votre lexique autant que le nôtre.

À propos de l'auteur

Gaël Renaudin ↗

Fondateur · E-Cybercom · Nantes

Gaël est le fondateur d'E-Cybercom, agence spécialisée en référencement naturel (SEO) et référencement IA (GEO) basée à Nantes. Depuis 2022, il accompagne les entreprises françaises dans leur stratégie de visibilité sur Google et les moteurs de réponse IA — de la création de site WordPress haute performance à l'optimisation pour ChatGPT, Perplexity et les AI Overviews de Google.

Audit de visibilité gratuit →

Réponse sous 48h · Devis Gratuit · Sans engagement