Référencement Internet Web

Votre visibilité, notre expertise.

Schema markup : guide des données structurées pour le SEO

17 min de lecture

Tu publies du contenu soigné, bien rédigé, correctement optimisé — et pourtant tes résultats dans Google ressemblent à ceux de tout le monde. Pas d'étoiles, pas d'image, pas de FAQ dépliable, pas de prix affiché. Juste un lien bleu et deux lignes de texte. Pendant ce temps, certains concurrents affichent des résultats enrichis qui captent l'attention — et les clics — avant que l'internaute ne descende jusqu'à toi.

La différence tient souvent à un seul élément technique : le schema markup. Ces quelques lignes de code structuré, invisibles pour le visiteur mais déchiffrées par Google, transforment un résultat ordinaire en résultat enrichi (rich result). Selon les données agrégées par plusieurs études SEO (Milestone Research, 2023 ; Search Engine Journal, 2024), les pages avec des résultats enrichis obtiennent entre 20 et 35 % de clics en plus que les résultats standards. Et en 2026, avec la montée des AI Overviews et des moteurs génératifs, les données structurées jouent un rôle encore plus stratégique : elles aident les modèles de langage à comprendre, vérifier et citer ton contenu. L'optimisation pour ces moteurs IA, appelée GEO, repose en grande partie sur la qualité du balisage structuré.

Voici le guide complet pour comprendre, implémenter et tester le schema markup sur ton site.

Qu'est-ce que le schema markup ?

Le schema markup est un vocabulaire standardisé, défini sur Schema.org, qui permet de baliser le contenu d'une page web de manière compréhensible par les moteurs de recherche. Concrètement, tu ajoutes des métadonnées structurées à ton HTML pour décrire explicitement ce que contient ta page : un article, un produit, une FAQ, une recette, un événement, une entreprise locale.

L'origine : Schema.org

Schema.org est un projet collaboratif lancé en 2011 par Google, Microsoft (Bing), Yahoo et Yandex. L'objectif était simple : créer un vocabulaire commun pour que tous les moteurs de recherche comprennent le contenu web de la même manière. Aujourd'hui, selon Schema.org, plus de 45 millions de domaines utilisent ce vocabulaire, avec plus de 450 milliards d'objets balisés dans le monde.

Le vocabulaire couvre des centaines de types d'entités (Article, Product, Person, Organization, Event, Recipe, etc.) et des milliers de propriétés (name, description, datePublished, author, price, etc.). Tu ne balises pas tout — tu choisis les types pertinents pour ton contenu et ton secteur.

Pourquoi Google adore les données structurées

Google n'a pas besoin du schema markup pour indexer ta page. Son crawler est capable d'extraire du sens à partir du HTML brut. Mais les données structurées éliminent l'ambiguïté. Au lieu de deviner que "42 EUR" est un prix et que "4.5/5" est une note, Google le sait avec certitude.

Ce gain de clarté se traduit par deux avantages concrets :

  • Les résultats enrichis : étoiles, prix, images, FAQ, breadcrumbs, fil d'Ariane — tous ces éléments visuels qui différencient ton résultat dans les SERP
  • L'éligibilité aux fonctionnalités spéciales : Knowledge Panel, carrousel de produits, recettes en image, événements locaux

Et depuis 2024-2025, un troisième avantage émerge : les moteurs d'IA générative (Google Gemini, Perplexity, ChatGPT avec browsing) exploitent les données structurées pour identifier les entités, vérifier les faits et formuler des réponses citées. Un contenu bien balisé a plus de chances d'être cité dans une AI Overview qu'un contenu équivalent sans balisage.

JSON-LD : le format recommandé par Google

Trois formats existent pour implémenter le schema markup : Microdata (attributs HTML inline), RDFa (attributs HTML riches) et JSON-LD (bloc JavaScript séparé). Google recommande officiellement JSON-LD, et pour de bonnes raisons.

Pourquoi JSON-LD a gagné

JSON-LD (JavaScript Object Notation for Linked Data) se présente sous forme d'un bloc <script> inséré dans le <head> ou le <body> de ta page. Il est complètement séparé du HTML visible — ce qui signifie que tu peux l'ajouter, le modifier ou le supprimer sans toucher à la structure de ta page.

Les avantages par rapport à Microdata et RDFa :

  • Maintenance simplifiée : le balisage est centralisé dans un seul bloc, pas dispersé dans les attributs HTML
  • Compatibilité CMS : facile à injecter via un plugin, Google Tag Manager ou un composant React/Next.js
  • Lisibilité : le format JSON est naturel pour les développeurs web
  • Scalabilité : sur un site avec des milliers de pages, l'automatisation via templates est triviale

En pratique, l'écrasante majorité des sites modernes utilisent JSON-LD. Microdata subsiste sur des sites plus anciens, mais pour une implémentation neuve en 2026, JSON-LD est le choix par défaut.

Anatomie d'un bloc JSON-LD

Un bloc JSON-LD minimal contient toujours trois éléments obligatoires :

  • @context : toujours "https://schema.org" — indique le vocabulaire utilisé
  • @type : le type d'entité (Article, Product, FAQPage, etc.)
  • Les propriétés : les champs spécifiques au type choisi

Voici un exemple simple pour un article de blog :

{
  "@context": "https://schema.org",
  "@type": "Article",
  "headline": "Schema markup : guide des données structurées pour le SEO",
  "author": {
    "@type": "Organization",
    "name": "La rédaction"
  },
  "datePublished": "2026-02-03",
  "dateModified": "2026-02-03",
  "image": "https://exemple.com/images/schema-markup-hero.webp",
  "publisher": {
    "@type": "Organization",
    "name": "Référencement Internet Web",
    "logo": {
      "@type": "ImageObject",
      "url": "https://exemple.com/logo.png"
    }
  },
  "description": "Guide complet du schema markup et des données structurées JSON-LD."
}

Chaque propriété enrichit la compréhension de Google. Plus ton balisage est complet et précis, plus tu as de chances de déclencher un résultat enrichi.

Les types de schema markup essentiels pour le SEO

Google supporte officiellement une trentaine de types de données structurées pour les résultats enrichis. Tous ne sont pas pertinents pour tous les sites. Voici les types les plus impactants en 2026, avec leurs cas d'usage concrets.

Article et BlogPosting

Usage : articles de blog, pages éditoriales, actualités.

Le type Article (et son sous-type BlogPosting) est le balisage de base pour tout site éditorial. Il permet à Google d'afficher le titre, l'auteur, la date de publication et l'image dans les résultats de recherche.

Propriétés essentielles :

PropriétéObligatoireDescription
headlineOuiTitre de l'article (identique ou proche du H1)
authorOuiAuteur (Person ou Organization)
datePublishedOuiDate de publication ISO 8601
dateModifiedRecommandéDate de dernière mise à jour
imageOuiImage principale (min 1200px de large recommandé)
publisherOuiÉditeur avec logo
descriptionRecommandéRésumé de l'article
wordCountOptionnelNombre de mots

L'erreur classique : oublier le champ author ou le remplir avec un nom générique sans entité structurée. Google valorise les auteurs identifiables — c'est un signal E-E-A-T. Notre guide sur la rédaction SEO détaille comment renforcer ces signaux de crédibilité dans le contenu.

Product et Offer

Usage : pages produit e-commerce, comparatifs avec prix.

Le balisage Product affiche le prix, la disponibilité, la note et le nombre d'avis directement dans les résultats de recherche. Selon Google, les produits avec un schema markup complet sont significativement plus susceptibles d'apparaître dans Google Shopping et les résultats enrichis produit.

Propriétés clés :

  • name, image, description : identification du produit
  • offers (type Offer) : prix, devise, disponibilité (InStock, OutOfStock)
  • aggregateRating : note moyenne et nombre d'avis
  • brand : marque du produit
  • sku / gtin : identifiants uniques

Un piège fréquent : déclarer un produit InStock alors qu'il est en rupture. Google peut pénaliser les incohérences entre le balisage et le contenu visible de la page.

FAQ (FAQPage)

Usage : pages avec des questions-réponses.

Le balisage FAQ affichait historiquement des questions dépliables directement dans les SERP, occupant un espace visuel considérable. Depuis août 2023, Google a restreint les résultats enrichis FAQ aux sites gouvernementaux et de santé pour la plupart des requêtes. Cependant, le balisage FAQ reste utile pour deux raisons :

  1. Les moteurs d'IA exploitent le format Q&A structuré pour extraire des réponses précises
  2. Bing et d'autres moteurs continuent d'afficher des résultats enrichis FAQ
  3. Google peut réactiver les rich results FAQ pour certains secteurs ou requêtes

Le format reste simple — un FAQPage contenant un tableau de Question avec chacune un acceptedAnswer de type Answer.

Usage : toutes les pages avec un fil d'Ariane.

Le balisage BreadcrumbList affiche le chemin de navigation directement dans les SERP à la place de l'URL brute. Au lieu de voir exemple.com/blog/schema-markup-seo, l'internaute voit Accueil > Blog > SEO technique — plus lisible, plus cliquable.

C'est l'un des types les plus simples à implémenter et les plus universellement utiles. Il n'y a aucune raison de ne pas l'avoir sur un site avec une structure hiérarchique.

LocalBusiness

Usage : entreprises avec une adresse physique.

Pour le SEO local, le balisage LocalBusiness est fondamental. Il alimente le Knowledge Panel et le pack local Google Maps avec les informations de l'entreprise : adresse, horaires, téléphone, avis, coordonnées GPS.

Propriétés essentielles : name, address (PostalAddress), telephone, openingHoursSpecification, geo (GeoCoordinates), aggregateRating.

HowTo

Usage : tutoriels et guides pas à pas.

Le balisage HowTo décrivait les étapes d'un processus avec temps estimé, outils et matériaux. Google a retiré les résultats enrichis HowTo des SERP en septembre 2023. Le balisage n'est plus affiché visuellement — mais il structure sémantiquement ton contenu pour les moteurs d'IA. Si tu publies des tutoriels, l'implémenter reste une bonne pratique pour la compréhension automatique de ton contenu, même sans rich result visible.

Autres types à connaître

TypeUsageRich result actif en 2026
EventÉvénements, conférencesOui
RecipeRecettes de cuisineOui
VideoObjectVidéos (YouTube, auto-hébergées)Oui
JobPostingOffres d'emploiOui
ReviewAvis et critiquesOui
OrganizationPage "À propos"Knowledge Panel
SoftwareApplicationApps et logicielsOui

Implémenter le schema markup : méthode pas à pas

Passer de la théorie à la pratique. Voici la méthode en cinq étapes pour ajouter des données structurées sur ton site.

Étape 1 : identifier les types pertinents

Analyse ton contenu page par page et détermine quel type de schema correspond :

  • Page d'accueil : Organization + WebSite (avec SearchAction pour le sitelinks search box)
  • Articles de blog : Article ou BlogPosting + BreadcrumbList
  • Pages produit : Product + Offer + BreadcrumbList
  • Pages FAQ : FAQPage + les questions
  • Page contact : LocalBusiness (si activité locale)

Ne balise pas tout avec tout. Chaque type doit correspondre au contenu réel de la page. Google pénalise les balisages trompeurs — déclarer un article comme un Product, par exemple, est une violation des guidelines.

Étape 2 : générer le code JSON-LD

Plusieurs options selon ton profil technique :

  • Écriture manuelle : si tu maîtrises JSON, écris directement le bloc en t'appuyant sur la documentation Google Search Central
  • Générateurs en ligne : TechnicalSEO.com, Merkle ou l'outil de Rank Math génèrent du JSON-LD valide à partir de formulaires
  • Plugins CMS : Yoast SEO (WordPress), Rank Math, Schema Pro — ils génèrent automatiquement les données structurées à partir des champs existants
  • Code custom : pour les sites Next.js, React ou headless, tu intègres le JSON-LD dans un composant via une balise script type="application/ld+json"

Étape 3 : insérer le balisage dans la page

Le bloc JSON-LD peut être placé dans le <head> ou n'importe où dans le <body>. Google le lira quel que soit son emplacement. La convention est de le placer dans le <head> pour les données globales (Organization, WebSite) et dans le <body> pour les données spécifiques à la page (Article, Product).

Tu peux avoir plusieurs blocs JSON-LD sur la même page. C'est même recommandé : un bloc pour le BreadcrumbList, un autre pour l'Article, un troisième pour la FAQ si la page en contient une. Chaque bloc est indépendant.

Étape 4 : valider avec les outils Google

Deux outils de validation :

  1. Rich Results Test (search.google.com/test/rich-results) : teste si ta page est éligible aux résultats enrichis Google. Il affiche les types détectés, les erreurs et les avertissements. C'est l'outil principal.
  2. Schema Markup Validator (validator.schema.org) : valide la syntaxe schema.org de manière générique, sans filtrage Google. Utile pour vérifier la conformité au vocabulaire Schema.org, y compris les types que Google ne supporte pas pour les rich results.

À chaque modification de balisage, passe par le Rich Results Test. Les erreurs les plus courantes :

  • Propriété obligatoire manquante (image, author pour Article)
  • URL d'image invalide ou inaccessible
  • Incohérence entre le balisage et le contenu visible
  • Format de date incorrect (doit être ISO 8601 : YYYY-MM-DD)

Étape 5 : monitorer dans la Search Console

Une fois le balisage déployé, surveille les rapports dans Google Search Console, section "Améliorations". Tu y trouves :

  • Le nombre de pages avec des données structurées valides
  • Les erreurs détectées par type
  • Les impressions et clics des résultats enrichis
  • L'évolution dans le temps

Un balisage valide ne garantit pas un résultat enrichi. Google décide au cas par cas, selon la requête, la qualité du contenu et la concurrence. Mais un balisage invalide garantit que tu n'auras jamais de résultat enrichi — donc la validation est un prérequis, pas une option.

Les changements de 2025 : ce que Google a retiré

Google fait régulièrement le ménage dans les types de données structurées qu'il supporte pour les résultats enrichis. En 2025, plusieurs types ont été dépréciés :

  • HowTo : résultats enrichis retirés depuis septembre 2023, officiellement abandonné
  • FAQ : restreint aux sites gouvernementaux et de santé depuis août 2023
  • Book actions : abandonné en juin 2025
  • Course info : abandonné en juin 2025
  • Claim Review : abandonné en juin 2025
  • Estimated Salary : abandonné en juin 2025
  • Special Announcement : abandonné

La raison avancée par Google : simplifier les SERP et se concentrer sur les résultats enrichis à fort impact et forte adoption. En pratique, cela signifie que certains balisages qui généraient autrefois des résultats visuels spectaculaires (FAQ dépliable, étapes HowTo illustrées) ne produisent plus rien de visible dans Google.

Faut-il les retirer de ton code ? Pas nécessairement. Le balisage reste valide sur Schema.org, il est toujours exploité par Bing, les moteurs d'IA et d'autres consommateurs de données structurées. Le coût de maintenance est quasi nul une fois en place. Mais concentre tes efforts d'implémentation sur les types qui génèrent encore des résultats enrichis : Article, Product, BreadcrumbList, LocalBusiness, Event, Recipe, VideoObject.

Schema markup et IA : le nouveau terrain de jeu

Le rôle des données structurées dépasse désormais les seuls résultats enrichis classiques. Avec la montée des AI Overviews de Google et des moteurs conversationnels (Perplexity, ChatGPT), le schema markup devient un signal de confiance pour les systèmes d'IA.

Pourquoi les LLM adorent les données structurées

Les modèles de langage qui naviguent le web (Perplexity, Google Gemini avec Grounding) cherchent à extraire des informations fiables et vérifiables. Un contenu avec un balisage Article contenant un auteur identifiable, une date de publication et une source (publisher) est perçu comme plus fiable qu'un contenu sans métadonnées explicites.

Les données structurées facilitent trois tâches critiques pour les LLM :

  1. Identification des entités : qui a écrit quoi, quand, pour quel éditeur
  2. Vérification des faits : les prix, dates, notes et statistiques balisés sont plus faciles à cross-référencer
  3. Attribution des sources : quand un moteur IA cite une source, il s'appuie souvent sur les métadonnées structurées pour générer le lien et le crédit

Optimiser son schema pour l'ère GEO

Pour maximiser tes chances d'être cité par les moteurs d'IA en 2026, quelques bonnes pratiques supplémentaires :

  • Balise tes auteurs avec sameAs : lie le profil auteur à LinkedIn, Twitter ou un site personnel. Les moteurs d'IA utilisent ces signaux pour évaluer l'expertise (E-E-A-T).
  • Utilise speakable : cette propriété Schema.org indique les sections les plus adaptées à la synthèse vocale et à l'extraction par les assistants IA.
  • Détaille le about : la propriété about permet de lier ton contenu à des concepts Schema.org ou Wikidata, aidant les IA à catégoriser ton contenu.
  • Mets à jour dateModified : les moteurs d'IA privilégient le contenu frais. Une date de modification récente est un signal positif.

Erreurs fréquentes et comment les éviter

Après des années d'audits de sites, voici les erreurs de schema markup les plus courantes — et leurs solutions.

Balisage qui contredit le contenu visible

Google exige la cohérence entre ce que le balisage déclare et ce que le visiteur voit. Exemples de violations :

  • Déclarer une note aggregateRating de 4.8/5 alors que la page n'affiche pas d'avis
  • Indiquer un prix en Offer différent du prix affiché
  • Baliser un article avec un auteur qui n'apparaît nulle part sur la page

La sanction : action manuelle Google (rare mais possible) ou simplement l'ignorance du balisage.

Balisage sur la mauvaise page

Un balisage Product sur une page catégorie qui liste 50 produits, au lieu de la page produit individuelle. Un balisage LocalBusiness sur le blog au lieu de la page contact. Chaque type doit être appliqué sur la page la plus pertinente.

Propriétés obligatoires manquantes

Le Rich Results Test signale les propriétés manquantes. Les oublis les plus fréquents :

  • image pour Article (obligatoire pour les résultats enrichis)
  • author pour Article
  • offers pour Product (sans Offer, pas de prix affiché)
  • address pour LocalBusiness

JSON-LD invalide

Erreurs de syntaxe JSON : virgule en trop, guillemets manquants, accolades non fermées. Un validateur JSON classique attrape ces erreurs avant même de passer au Rich Results Test.

Checklist schema markup pour ton site

Pour clore ce guide, voici la checklist actionnable à suivre pour implémenter les données structurées sur ton site :

  • Organisation : balisage Organization sur la page d'accueil (nom, logo, URL, réseaux sociaux via sameAs)
  • Site web : balisage WebSite avec SearchAction si tu as un moteur de recherche interne
  • Articles : Article ou BlogPosting sur chaque page éditoriale (headline, author, datePublished, image, publisher)
  • Fil d'Ariane : BreadcrumbList sur toutes les pages avec une hiérarchie de navigation
  • Produits : Product + Offer sur chaque page produit (nom, prix, disponibilité, image)
  • FAQ : FAQPage si ta page contient des questions-réponses explicites
  • Entreprise locale : LocalBusiness sur la page contact/à propos — particulièrement utile pour les sites de tourisme viticole ou les commerces locaux
  • Validation : Rich Results Test sur chaque template de page
  • Monitoring : Google Search Console, rapport "Améliorations", vérifié mensuellement

Les données structurées ne sont pas un bonus technique réservé aux développeurs. C'est un levier SEO concret qui améliore la visibilité dans les SERP classiques, optimise la présence dans les résultats IA et renforce la crédibilité de ton contenu auprès de Google et des LLM. En 2026, ne pas baliser son site, c'est laisser des clics sur la table.

Sources


À lire aussi