Aller au contenu
Schema markup : guide des données structurées pour le SEO

Schema markup : guide des données structurées pour le SEO

Par Guillaume P.

15 min de lecture
Lien copié dans le presse-papiers
Guillaume P.

Tu publies du contenu bon, mais tes résultats Google sont génériques. Pas d'étoiles, pas d'image, pas de FAQ dépliable, pas de prix. Juste un lien bleu. Tes concurrents eux affichent des résultats enrichis, et ça saute aux yeux. Google a inventé un mot pour dire "on vous prend vos clics" : AI Overviews.

La différence ? Le schema markup. Quelques lignes de code invisible au visiteur, lisible pour Google. Les pages balisées reçoivent 20-35 % plus de clics (Milestone Research 2023, Search Engine Journal 2024). Et en 2026, avec les AI Overviews qui montent, le balisage structuré devient encore plus critique : les LLM l'utilisent pour comprendre, vérifier et citer ton contenu. C'est devenu inévitable.

Voici le guide complet pour comprendre, implémenter et tester le schema markup sur ton site.

Qu'est-ce que le schema markup ?#

Le schema markup est un vocabulaire standardisé, défini sur Schema.org, qui permet de baliser le contenu d'une page web de manière compréhensible par les moteurs de recherche. Concrètement, tu ajoutes des métadonnées structurées à ton HTML pour décrire explicitement ce que contient ta page : un article, un produit, une FAQ, une recette, un événement, une entreprise locale.

L'origine : Schema.org#

Schema.org est un projet collaboratif lancé en 2011 par Google, Microsoft (Bing), Yahoo et Yandex. L'objectif était simple : créer un vocabulaire commun pour que tous les moteurs de recherche comprennent le contenu web de la même manière. Aujourd'hui, selon Schema.org, plus de 45 millions de domaines utilisent ce vocabulaire, avec plus de 450 milliards d'objets balisés dans le monde.

Le vocabulaire couvre des centaines de types d'entités (Article, Product, Person, Organization, Event, Recipe, etc.) et des milliers de propriétés (name, description, datePublished, author, price, etc.). Tu ne balises pas tout, tu choisis les types pertinents pour ton contenu et ton secteur.

Pourquoi Google veut du balisage#

Google peut indexer ta page sans schema. Mais le balisage élimine l'ambiguïté. Au lieu de deviner, Google sait : "42 EUR" = prix, "4.5/5" = note, c'est net.

Le balisage génère des résultats enrichis (étoiles, prix, images, FAQ, breadcrumbs) qui te différencient visuellement. Il active des fonctionnalités spéciales comme le Knowledge Panel, les carrousels produits et les événements locaux. Depuis 2024, les moteurs d'IA (Google Gemini, Perplexity, ChatGPT) utilisent le schema pour identifier les entités, vérifier les faits et attribuer les sources, ce qui donne plus de chances au contenu balisé de figurer dans une AI Overview.

JSON-LD : le format recommandé par Google#

Trois formats existent pour implémenter le schema markup : Microdata (attributs HTML inline), RDFa (attributs HTML riches) et JSON-LD (bloc JavaScript séparé). Google recommande officiellement JSON-LD, et pour de bonnes raisons.

Pourquoi JSON-LD a gagné#

JSON-LD (JavaScript Object Notation for Linked Data) se présente sous forme d'un bloc <script> inséré dans le <head> ou le <body> de ta page. Il est complètement séparé du HTML visible, ce qui signifie que tu peux l'ajouter, le modifier ou le supprimer sans toucher à la structure de ta page.

JSON-LD offre une maintenance simplifiée puisque le balisage se concentre dans un seul bloc sans dispersion dans les attributs HTML. Il s'injecte facilement via plugin CMS, Google Tag Manager ou composant React. Le format JSON étant naturel pour les développeurs web, la lisibilité est meilleure. Et sur un site de milliers de pages, l'automatisation via templates devient triviale.

En pratique, l'écrasante majorité des sites modernes utilisent JSON-LD. Microdata subsiste sur des sites plus anciens, mais pour une implémentation neuve en 2026, JSON-LD est le choix par défaut.

Un bloc JSON-LD minimal exige trois éléments obligatoires : le contexte (toujours "https://schema.org"), le type d'entité (Article, Product, FAQPage, etc.), et les propriétés spécifiques au type choisi.

Voici un exemple simple pour un article de blog :

{
	"@context": "https://schema.org",
	"@type": "Article",
	"headline": "Schema markup : guide des données structurées pour le SEO",
	"author": {
		"@type": "Organization",
		"name": "La rédaction"
	},
	"datePublished": "2026-02-03",
	"dateModified": "2026-02-03",
	"image": "https://exemple.com/images/schema-markup-hero.webp",
	"publisher": {
		"@type": "Organization",
		"name": "Référencement Internet Web",
		"logo": {
			"@type": "ImageObject",
			"url": "https://exemple.com/logo.png"
		}
	},
	"description": "Guide complet du schema markup et des données structurées JSON-LD."
}

Chaque propriété enrichit la compréhension de Google. Plus ton balisage est complet et précis, plus tu as de chances de déclencher un résultat enrichi.

Les types de schema markup essentiels pour le SEO#

Google supporte officiellement une trentaine de types de données structurées pour les résultats enrichis. Tous ne sont pas pertinents pour tous les sites. Voici les types les plus impactants en 2026, avec leurs cas d'usage concrets.

Article et BlogPosting#

Usage : articles de blog, pages éditoriales, actualités.

Le type Article (et son sous-type BlogPosting) est le balisage de base pour tout site éditorial. Il permet à Google d'afficher le titre, l'auteur, la date de publication et l'image dans les résultats de recherche.

Propriétés essentielles :

PropriétéObligatoireDescription
headlineOuiTitre de l'article (identique ou proche du H1)
authorOuiAuteur (Person ou Organization)
datePublishedOuiDate de publication ISO 8601
dateModifiedRecommandéDate de dernière mise à jour
imageOuiImage principale (min 1200px de large recommandé)
publisherOuiÉditeur avec logo
descriptionRecommandéRésumé de l'article
wordCountOptionnelNombre de mots

Erreur fréquente : oublier author ou utiliser "Admin". Google valorise les auteurs nommés et vérifiables. C'est un signal E-E-A-T fort.

Product et Offer#

Usage : pages produit e-commerce, comparatifs avec prix.

Le balisage Product affiche le prix, la disponibilité, la note et le nombre d'avis directement dans les résultats de recherche. Selon Google, les produits avec un schema markup complet sont significativement plus susceptibles d'apparaître dans Google Shopping et les résultats enrichis produit.

Propriétés clés :

  • name, image, description : identification du produit
  • offers (type Offer) : prix, devise, disponibilité (InStock, OutOfStock)
  • aggregateRating : note moyenne et nombre d'avis
  • brand : marque du produit
  • sku / gtin : identifiants uniques

Un piège fréquent : déclarer un produit InStock alors qu'il est en rupture. Google peut pénaliser les incohérences entre le balisage et le contenu visible de la page.

FAQ (FAQPage)#

Usage : pages avec des questions-réponses.

Le balisage FAQ affichait historiquement des questions dépliables directement dans les SERP, occupant un espace visuel considérable. Depuis août 2023, Google a restreint les résultats enrichis FAQ aux sites gouvernementaux et de santé pour la plupart des requêtes. Cependant, le balisage FAQ reste utile pour deux raisons :

  1. Les moteurs d'IA exploitent le format Q&A structuré pour extraire des réponses précises
  2. Bing et d'autres moteurs continuent d'afficher des résultats enrichis FAQ
  3. Google peut réactiver les rich results FAQ pour certains secteurs ou requêtes

Le format reste simple, un FAQPage contenant un tableau de Question avec chacune un acceptedAnswer de type Answer.

Usage : toutes les pages avec un fil d'Ariane.

Le balisage BreadcrumbList affiche le chemin de navigation directement dans les SERP à la place de l'URL brute. Au lieu de voir exemple.com/blog/schema-markup-seo, l'internaute voit Accueil > Blog > SEO technique, plus lisible, plus cliquable.

C'est l'un des types les plus simples à implémenter et les plus universellement utiles. Il n'y a aucune raison de ne pas l'avoir sur un site avec une structure hiérarchique.

LocalBusiness#

Usage : entreprises avec une adresse physique.

Pour le SEO local, le balisage LocalBusiness est majeur. Il alimente le Knowledge Panel et le pack local Google Maps avec les informations de l'entreprise : adresse, horaires, téléphone, avis, coordonnées GPS.

Propriétés essentielles : name, address (PostalAddress), telephone, openingHoursSpecification, geo (GeoCoordinates), aggregateRating.

HowTo#

Usage : tutoriels et guides pas à pas.

Le balisage HowTo décrivait les étapes d'un processus avec temps estimé, outils et matériaux. Google a retiré les résultats enrichis HowTo des SERP en septembre 2023. Le balisage n'est plus affiché visuellement, mais il structure sémantiquement ton contenu pour les moteurs d'IA. Si tu publies des tutoriels, l'implémenter reste une bonne pratique pour la compréhension automatique de ton contenu, même sans rich result visible.

Autres types à connaître#

Pour les événements et conférences, utilisez le type Event qui affiche les dates et lieux dans les résultats enrichis. Les recettes de cuisine relèvent du type Recipe avec temps de préparation, ingrédients et étapes. Les vidéos (YouTube ou auto-hébergées) utilisent VideoObject, tout comme les offres d'emploi qui recourent à JobPosting.

Les avis et critiques recourent au type Review pour afficher les notes et commentaires. Les pages "À propos" ou pages institutionnelles utilisent Organization qui alimente le Knowledge Panel. Enfin, les apps et logiciels se balisent avec SoftwareApplication pour apparaître dans les résultats e-commerce et les galeries Google.

Implémenter le schema : 5 étapes#

Passer à la pratique.

Étape 1 : identifier les types pertinents#

Analyse ton contenu page par page et détermine quel type de schema correspond. La page d'accueil requiert Organization + WebSite (avec SearchAction pour le sitelinks search box). Les articles de blog utilisent Article ou BlogPosting + BreadcrumbList. Les pages produit nécessitent Product + Offer + BreadcrumbList. Les pages FAQ demandent FAQPage + les questions structurées. Les pages contact qui sont une activité locale recourent à LocalBusiness.

Ne balise pas tout avec tout. Chaque type doit correspondre au contenu réel de la page. Google pénalise les balisages trompeurs. Déclarer un article comme un Product, par exemple, viole les guidelines et peut entraîner une action manuelle.

Étape 2 : générer le code JSON-LD#

Plusieurs options selon ton profil technique. L'écriture manuelle convient si tu maîtrises JSON, écris directement le bloc en t'appuyant sur la documentation Google Search Central. Les générateurs en ligne comme TechnicalSEO.com, Merkle ou Rank Math génèrent du JSON-LD valide à partir de formulaires.

Les plugins CMS comme Yoast SEO (WordPress), Rank Math et Schema Pro génèrent automatiquement les données structurées à partir des champs existants. Pour les sites Next.js, React ou headless, intègre le JSON-LD dans un composant via une balise script type="application/ld+json".

Étape 3 : insérer le balisage dans la page#

Le bloc JSON-LD peut être placé dans le <head> ou n'importe où dans le <body>. Google le lira quel que soit son emplacement. La convention est de le placer dans le <head> pour les données globales (Organization, WebSite) et dans le <body> pour les données spécifiques à la page (Article, Product).

Tu peux avoir plusieurs blocs JSON-LD sur la même page. C'est même recommandé : un bloc pour le BreadcrumbList, un autre pour l'Article, un troisième pour la FAQ si la page en contient une. Chaque bloc est indépendant.

Étape 4 : valider avec les outils Google#

Deux outils de validation sont essentiels. Le Rich Results Test (search.google.com/test/rich-results) teste si ta page est éligible aux résultats enrichis Google, affichant les types détectés, les erreurs et les avertissements, c'est l'outil principal. Le Schema Markup Validator (validator.schema.org) valide la syntaxe schema.org de manière générique, sans filtrage Google, utile pour vérifier la conformité au vocabulaire, y compris les types non supportés pour les rich results.

À chaque modification, valide par le Rich Results Test. Les erreurs récurrentes : propriétés obligatoires manquantes (image ou author pour Article), URL d'image invalide ou inaccessible, incohérence entre balisage et contenu visible, format de date incorrect (ISO 8601 obligatoire : YYYY-MM-DD).

Étape 5 : monitorer dans la Search Console#

Une fois le balisage déployé, surveille les rapports dans Google Search Console, section "Améliorations". Tu y trouves :

  • Le nombre de pages avec des données structurées valides
  • Les erreurs détectées par type
  • Les impressions et clics des résultats enrichis
  • L'évolution dans le temps

Un balisage valide ne garantit pas un résultat enrichi. Google décide au cas par cas, selon la requête, la qualité du contenu et la concurrence. Mais un balisage invalide garantit que tu n'auras jamais de résultat enrichi, donc la validation est un prérequis, pas une option.

Les changements de 2025 : ce que Google a retiré#

Google fait régulièrement le ménage dans les types de données structurées qu'il supporte pour les résultats enrichis. En 2025, plusieurs types ont été dépréciés :

  • HowTo : résultats enrichis retirés depuis septembre 2023, officiellement abandonné
  • FAQ : restreint aux sites gouvernementaux et de santé depuis août 2023
  • Book actions : abandonné en juin 2025
  • Course info : abandonné en juin 2025
  • Claim Review : abandonné en juin 2025
  • Estimated Salary : abandonné en juin 2025
  • Special Announcement : abandonné

La raison avancée par Google : simplifier les SERP et se concentrer sur les résultats enrichis à fort impact et forte adoption. En pratique, cela signifie que certains balisages qui généraient autrefois des résultats visuels spectaculaires (FAQ dépliable, étapes HowTo illustrées) ne produisent plus rien de visible dans Google.

Faut-il les retirer de ton code ? Pas nécessairement. Le balisage reste valide sur Schema.org, il est toujours exploité par Bing, les moteurs d'IA et d'autres consommateurs de données structurées. Le coût de maintenance est quasi nul une fois en place. Mais concentre tes efforts d'implémentation sur les types qui génèrent encore des résultats enrichis : Article, Product, BreadcrumbList, LocalBusiness, Event, Recipe, VideoObject.

Schema markup et IA : le nouveau terrain de jeu#

Le rôle des données structurées dépasse désormais les seuls résultats enrichis classiques. Avec la montée des AI Overviews de Google et des moteurs conversationnels (Perplexity, ChatGPT), le schema markup devient un signal de confiance pour les systèmes d'IA.

Pourquoi les LLM adorent les données structurées#

Les modèles de langage qui naviguent le web (Perplexity, Google Gemini avec Grounding) cherchent à extraire des informations fiables et vérifiables. Un contenu avec un balisage Article contenant un auteur identifiable, une date de publication et une source (publisher) est perçu comme plus fiable qu'un contenu sans métadonnées explicites.

Les données structurées facilitent trois tâches critiques pour les LLM :

  1. Identification des entités : qui a écrit quoi, quand, pour quel éditeur
  2. Vérification des faits : les prix, dates, notes et statistiques balisés sont plus faciles à cross-référencer
  3. Attribution des sources : quand un moteur IA cite une source, il s'appuie souvent sur les métadonnées structurées pour générer le lien et le crédit

Optimiser son schema pour l'ère GEO#

Pour maximiser tes chances d'être cité, balise tes auteurs avec sameAs (LinkedIn, Twitter, site personnel) afin que les moteurs d'IA évaluent l'expertise (E-E-A-T). Utilise speakable pour signaler les sections adaptées à la synthèse vocale et l'extraction IA. Détaille le about pour lier ton contenu à Schema.org ou Wikidata, facilitant la catégorisation. Mets à jour régulièrement dateModified car les moteurs d'IA privilégient le contenu frais.

Erreurs fréquentes et comment les éviter#

Les erreurs de schema markup les plus courantes proviennent d'une incohérence entre le balisage et le contenu visible. Google exige cette cohérence strictement. Déclarer une note de 4.8/5 alors que la page n'affiche aucun avis, indiquer un prix différent en Offer, ou baliser un article avec un auteur inexistant sur la page : ce sont des violations flagrantes qui entraînent ignoration du balisage ou actions manuelles.

La sanction : action manuelle Google (rare mais possible) ou simplement l'ignorance du balisage.

Balisage sur la mauvaise page#

Un balisage Product sur une page catégorie qui liste 50 produits, au lieu de la page produit individuelle. Un balisage LocalBusiness sur le blog au lieu de la page contact. Chaque type doit être appliqué sur la page la plus pertinente.

Le Rich Results Test vous signale les propriétés manquantes. Les oublis récurrents : image pour Article (obligatoire pour résultats enrichis), author (évaluation E-E-A-T), offers pour Product (nécessaire pour afficher prix), address pour LocalBusiness.

Les erreurs de syntaxe JSON (virgule en trop, guillemets manquants, accolades non fermées) sont attrapées par tout validateur JSON classique avant même d'utiliser le Rich Results Test.

Checklist schema markup pour ton site#

Pour clore ce guide, voici la checklist actionnable à suivre pour implémenter les données structurées sur ton site :

  • Organisation : balisage Organization sur la page d'accueil (nom, logo, URL, réseaux sociaux via sameAs)
  • Site web : balisage WebSite avec SearchAction si tu as un moteur de recherche interne
  • Articles : Article ou BlogPosting sur chaque page éditoriale (headline, author, datePublished, image, publisher)
  • Fil d'Ariane : BreadcrumbList sur toutes les pages avec une hiérarchie de navigation
  • Produits : Product + Offer sur chaque page produit (nom, prix, disponibilité, image)
  • FAQ : FAQPage si ta page contient des questions-réponses explicites
  • Entreprise locale : LocalBusiness sur la page contact, vitale pour les restaurants, magasins, services locaux
  • Validation : Rich Results Test sur chaque template de page
  • Monitoring : Google Search Console, rapport "Améliorations", vérifié mensuellement

Le schema markup n'est pas un truc de développeur. C'est un levier SEO qui améliore les SERP, optimise votre présence IA, renforce la crédibilité auprès de Google et des LLM. En 2026, ne pas baliser, c'est laisser des clics sur la table. Point.

Sources#

Lien copié dans le presse-papiers

À lire aussi