Mise en valeur : le blog du marketing digital
  • Communication digitale
  • Content marketing
  • Référencement naturel
  • Acquisition client
  • Rechercher
  • Menu Menu
Vous êtes ici : Mise en Valeur1 / Référencement naturel2 / Comment ne pas référencer une page web ?

Comment ne pas référencer une page web ?

Référencement naturel
Comment ne pas indexer une page web ?

En matière de référencement web, il est parfois intéressant de ne pas référencer une page web, ou plutôt de ne pas l’indexer. En effet, certaines pages de votre site web peuvent ne pas avoir d’intérêt particulier pour Google. Dans ce type de cas, il est intéressant de savoir comment ne pas référencer une page web et comment empêcher son indexation par Google. Nous vous expliquons tout sur le sujet !

  • Pourquoi ne pas référencer une page web ?
    • Rappel sur le référencement et l’indexation d’une page web
    • Dans quels cas ne pas indexer une page ?
  • Comment ne pas référencer une page web ? Les différentes options
    • Le fichier robots.txt
    • Code source pour ne pas référencer une page (balise noindex)
    • Désindexer une page sur WordPress
    • Utilisation de mots de passe
    • La Google Search Console
  • Quelles pages web faut-il désindexer ?

Pourquoi ne pas référencer une page web ?

Avant toute chose, il est important de rappeler quel est l’intérêt de déréférencer une page web. En effet, il s’agit là d’une pratique très spécifique, qui ne doit concerner qu’une petite série de pages de votre site internet.

Rappel sur le référencement et l’indexation d’une page web

Rappelons en premier lieu le principe de référencement et d’indexation d’un site web.

Une page web indexée est une page web connue et listée par les moteurs de recherche dans leurs résultats. Il faut savoir que Google et consorts utilisent des robots (des programmes) pour parcourir les pages d’un site internet.

Toute page jugée suffisamment qualitative par ces robots peut être référencée par un moteur de recherche (on parle d’indexation de la page pour désigner le fait d’ajouter la page dans les résultats des moteurs de recherche).

Une fois une page indexée, les internautes peuvent parfois tomber sur cette dernière au détour de leurs recherches internet.

On notera que l’indexation d’une page n’est pas suffisante pour gagner de la visibilité en ligne. Ce qui vous intéresse pour cela est le positionnement d’une page web, à savoir sa position dans les pages des résultats de recherche (SERP). C’est la différence entre indexation (la page est présente dans les SERP) et le référencement (la page est bien positionnée dans les SERP).

Mais l’indexation de la page reste la première étape essentielle pour gagner du trafic web.

Dans quels cas ne pas indexer une page ?

En toute logique, une page web non indexée est une page web totalement inconnue des moteurs de recherche. C’est donc une page qui n’apparaîtra jamais dans les SERP Google.

Sur le point du SEO, ne pas référencer ses pages web est forcément dramatique. Néanmoins, il existe des cas dans lesquels il peut être intéressant de ne pas faire référencer une page web dans les résultats de recherche.

Pour dire les choses globalement, les pages web à ne pas indexer sont celles que vous ne souhaitez pas mettre en avant auprès de votre public ou auprès de Google.

Il peut par exemple s’agir de pages sans aucun enjeu SEO, par exemple les pages légales (mentions légales, CGU, etc.). Il peut également s’agir de pages que vous ne souhaitez pas voir apparaître dans les résultats de recherche (une landing page par exemple).

À savoir : s’il est toujours possible de désindexer une page web déjà référencée, il sera préférable d’empêcher l’indexation dès la création de la page web.

Comment ne pas référencer une page web ? Les différentes options

Après avoir planté le décor, voyons ensemble comment ne pas référencer une page web, ou plutôt comment ne pas l’indexer.

Il existe en effet différentes techniques pour éviter l’indexation d’une page en particulier. Rappelons que ces techniques doivent être appliquées avec prudence, et uniquement sur les pages que vous ne souhaitez pas voir indexées par Google.

Le fichier robots.txt

Quand on parle d’indexation d’un site internet, le fichier robots.txt est forcément important.

Le fichier robots.txt est un fichier texte qui communique des autorisations aux moteurs de recherche. Il indique notamment si les robots de crawling peuvent indexer le site, et quelles sont les pages à indexer ou non.

Ce fichier doit être placé à la racine du site et peut contenir différentes consignes pour les moteurs de recherche.

Le fichier robots.txt peut empêcher l’indexation de certaines pages web. Pour cela, il faut utiliser la mention « Disallow: » suivie du chemin de la page à ne pas indexer.

Par exemple, si je souhaite ne pas indexer la page « www.mise-en-valeur.fr/referencement-naturel » de ce site web, je peux ajouter la ligne suivante dans mon fichier robots.txt :

User-agent: *
Disallow: /referencement-naturel/

Attention, la commande Disallow va bloquer tout le répertoire. Dans mon exemple, l’URL « www.mise-en-valeur.fr/referencement-naturel/link-juice/ » serait aussi bloquée, car elle est contenue dans le répertoire « referencement-naturel ».

Cette technique sera uniquement intéressante si vous souhaitez empêcher l’indexation de quelques pages web ou de quelques répertoires. Forcément, elle sera moins pertinente si vous avez fréquemment intérêt à désindexer des pages web.

À savoir : notez également que le fichier robots.txt est aisément accessible. Mieux vaut donc éviter d’y lister les pages « sensibles » que vous souhaiteriez déréférencer, car n’importe qui pourrait alors rapidement avoir accès à ces pages en consultant votre fichier robots.txt !

Le fichier Robots.txt permet d’empêcher l’indexation d’une page ou d’un répertoire auprès de tous les moteurs de recherche.

Code source pour ne pas référencer une page (balise noindex)

Si le robots.txt peut empêcher l’indexation au niveau du site, il est également possible d’empêcher l’indexation au niveau de la page.

La balise Meta « noindex » permet de ne pas référencer une page web. Il s’agit d’un code à ajouter en en-tête de la page HTML, entre les balises <head>. Le code source pour ne pas référencer une page est le suivant :

<meta name="robots" content="noindex">

Les principaux moteurs de recherche prendront en compte cette directive et ne référenceront pas une page web qui contient cette balise. On notera néanmoins que la balise ne peut fonctionner que si la page en question n’est pas bloquée par le fichier robots.txt.

C’est notamment la technique préconisée par Google pour bloquer l’indexation dans la recherche.

À savoir : si vous souhaitez indexer une page qui avait préalablement reçu la balise « noindex », il peut être intéressant de remplacer « noindex » par « index » dans le code source de la page. Cela signifiera clairement aux moteurs de recherche qu’il y a eu un changement de règles concernant cette page. 

Balise noindex meta

La balise noindex reste le meilleur moyen de ne pas indexer une page web particulière.

Désindexer une page sur WordPress

On notera qu’il est parfois complexe de désindexer une page sur WordPress, notamment car l’accès aux balises <head> n’est pas permis. Il est donc difficile d’intégrer la valise noindex. Qu’à cela ne tienne !

Il existe différentes extensions qui peuvent permettre de désindexer chaque page.

La plupart des extensions SEO de WordPress permettent d’ajouter facilement une balise noindex, lors de l’édition d’une page ou d’un article. Ces extensions sont souvent gratuites ou en freemium, et offrent de nombreuses fonctionnalités en termes de référencement naturel.

Nous vous conseillons pour cela d’utiliser RankMaths, une excellente extension SEO pour WordPress. Il existe bien évidemment d’autres alternatives, comme YoastSEO ou SEOPress.

Il existe également des extensions uniquement conçues pour permettre d’ajouter la balise noindex (et qui n’ont donc pas d’autres fonctionnalités), à l’instar de noindex SEO.

Utilisation de mots de passe

Une manière plus élémentaire d’empêcher l’indexation d’une page web est de la rendre privée, et accessible uniquement par mot de passe.

Une page protégée par mot de passe ne peut pas être indexée par les moteurs de recherche. Si vous avez besoin de désindexer différentes parties de votre site parce qu’elles sont privées ou qu’il s’agit de contenu premium, la meilleure solution est de mette en place un système de mots de passe et d’accès utilisateurs.

Naturellement, cette technique ne fonctionne pas si vous avez besoin que la page en question puisse être accessible par tous les internautes qui utilisent votre site web (par exemple s’il s’agit des mentions légales).

La Google Search Console

Si vous souhaitez désindexer différentes pages déjà présentes sur Google, il est possible d’utiliser pour cela la Google Search Console.

Pour cela, il vous suffit de vous rendre sur votre compte Google Search Console et de suivre ces étapes :

  1. Dans « Indexation », cliquez sur « Suppressions ».
  2. Indiquez l’URL à supprimer.
  3. Choisissez entre supprimer uniquement l’URL (une seule page) ou toutes les URL avec ce préfixe (pour désindexer tout un répertoire, par exemple).

Cette solution permet uniquement de désindexer des pages sur Google, et pas sur les autres moteurs de recherche. C’est surtout une manière rapide de désindexer une page déjà référencée, mais sur laquelle vous avez ajouté une balise noindex, avant que Google ne la crawle à nouveau.

Supprimer indexation Google

La Google Search Console permet de désindexer des pages déjà indexées par Google.

Quelles pages web faut-il désindexer ?

Vous aurez compris qu’il existe différentes solutions pour désindexer une page et empêcher son référencement. La balise noindex reste le meilleur moyen d’indiquer aux moteurs de recherche qu’une page ne doit pas être indexée.

Ceci dit, rappelons que le fait de ne pas référencer une page web reste une exception ! En théorie, vous avez forcément intérêt à ce que les pages de votre site internet soient connues de Google et de ses confrères.

Seules certaines pages de votre site web doivent être désindexées, et notamment les pages suivantes :

  • Toutes les pages utilisées pour le back-office et les pages techniques.
  • Toutes les pages réservées à un usage interne à l’entreprise (mieux vaut alors créer un intranet accessible par mot de passe).
  • Les pages indexées par erreur et que vous souhaitiez privées.
  • Les pages que vous ne souhaitez pas voir apparaître pour raison juridique ou stratégique.
  • Les pages qui contiennent du contenu dupliqué (par exemple des fiches produits qui ont exactement les mêmes contenus).
  • Les pages qui n’ont pas d’intérêt pour Google ou qui ne sont pas qualitatives.

Pour rappel, la recherche Google « site: » suivie de votre URL (par exemple « site:www.mise-en-valeur.fr ») permet d’afficher toutes les pages indexées de votre site web. C’est une bonne manière de repérer les pages que vous ne souhaitiez pas voir référencées sur Google.

Vous en savez désormais plus sur la désindexation d’une page web ! Pour affiner votre stratégie de référencement naturel, n’hésitez pas à consulter notre dossier spécial « pourquoi mon site n’apparait pas sur Google » s’il s’agit d’une problématique qui peut également vous toucher.

Partager cette publication
  • Partager sur Facebook
  • Share on Twitter
  • Partager sur Pinterest
  • Partager sur LinkedIn
  • Partager par Mail
https://www.mise-en-valeur.fr/wp-content/uploads/2023/08/comment-ne-pas-referencer-une-page-web.jpg 600 800 Pierrick https://mise-en-valeur.fr/wp-content/uploads/2018/07/Logo-300x150.png Pierrick2023-08-11 12:58:352023-09-08 16:42:25Comment ne pas référencer une page web ?

À propos

#Mise en valeur est le blog du marketing digital, du référencement naturel et de la communication numérique des entreprises.

Découvrez tous les conseils pour mieux comprendre et appréhender le marketing web.

 

Parcourir le blog :

  • Acquisition client
  • Communication digitale
  • Content marketing
  • Management
  • Référencement naturel
Récent
  • La digitalisation en entreprise : quels sont les enjeux...
  • Comment créer une landing page ?
  • Comment créer un site internet ?
  • Comment lancer une stratégie pluri-média réussie ?
  • Trouver une formation en marketing digital
  • Définition du data management
Mis en avant
  • Communication digitale d'une entreprise
    Comprendre la communication digitale
  • E-réputation : définition
    E-réputation : définition et principes
  • Référencement naturel : définition
    Les bases du SEO (référencement naturel)
  • Inbound Marketing en France
    Inbound marketing : définition et applications
  • Création d'un site vitrine
    Création d’un site vitrine : intérêts et limit...
  • Marketing de contenus : définition
    Content marketing : définition et usages

Table des matières

  • Pourquoi ne pas référencer une page web ?
    • Rappel sur le référencement et l’indexation d’une page web
    • Dans quels cas ne pas indexer une page ?
  • Comment ne pas référencer une page web ? Les différentes options
    • Le fichier robots.txt
    • Code source pour ne pas référencer une page (balise noindex)
    • Désindexer une page sur WordPress
    • Utilisation de mots de passe
    • La Google Search Console
  • Quelles pages web faut-il désindexer ?

Le blog du marketing numérique

Logo Mise en Valeur
Lien vers Communication digitale dans category

Communication digitale

Découvrez comment faire connaître votre entreprise sur internet !

Lien vers Content marketing dans category

Content marketing

Apprenez à utiliser la création de contenus dans votre stratégie marketing !

Lien vers Référencement naturel dans category

Référencement naturel

Attirez plus de trafic naturel sur le site internet de votre entreprise !

Lien vers Acquisition client dans category

Acquisition
client

Générez plus de contacts entrants afin de multiplier les prospects !

  • Contact et à propos
  • Plan du site
  • Mentions légales
  • Politique de cookies (UE)

© Copyright 2017-2024 #Mise en valeur, le blog du marketing numérique
Faire défiler vers le haut
Gérer le consentement aux cookies
Pour offrir les meilleures expériences, nous utilisons des technologies telles que les cookies pour stocker et/ou accéder aux informations des appareils. Le fait de consentir à ces technologies nous permettra de traiter des données telles que le comportement de navigation ou les ID uniques sur ce site. Le fait de ne pas consentir ou de retirer son consentement peut avoir un effet négatif sur certaines caractéristiques et fonctions.
Fonctionnel Toujours activé
Le stockage ou l’accès technique est strictement nécessaire dans la finalité d’intérêt légitime de permettre l’utilisation d’un service spécifique explicitement demandé par l’abonné ou l’internaute, ou dans le seul but d’effectuer la transmission d’une communication sur un réseau de communications électroniques.
Préférences
L’accès ou le stockage technique est nécessaire dans la finalité d’intérêt légitime de stocker des préférences qui ne sont pas demandées par l’abonné ou l’internaute.
Statistiques
Le stockage ou l’accès technique qui est utilisé exclusivement à des fins statistiques. Le stockage ou l’accès technique qui est utilisé exclusivement dans des finalités statistiques anonymes. En l’absence d’une assignation à comparaître, d’une conformité volontaire de la part de votre fournisseur d’accès à internet ou d’enregistrements supplémentaires provenant d’une tierce partie, les informations stockées ou extraites à cette seule fin ne peuvent généralement pas être utilisées pour vous identifier.
Marketing
Le stockage ou l’accès technique est nécessaire pour créer des profils d’internautes afin d’envoyer des publicités, ou pour suivre l’internaute sur un site web ou sur plusieurs sites web ayant des finalités marketing similaires.
Gérer les options Gérer les services Gérer {vendor_count} fournisseurs En savoir plus sur ces finalités
Voir les préférences
{title} {title} {title}