(Mis à jour le: 27 janvier 2022)
4.7/5 - (4 votes)

Maillage interne : la méthode N-gramme pour déterminer les pages à mailler en priorité

Lorsqu’on parle de netlinking, on a tendance à accorder plus d’importance aux backlinks qu’aux liens internes. Ces derniers représentent pourtant la colonne vertébrale de votre stratégie SEO puisque permettent d’organiser et de fluidifier la navigation sur votre site. Bien travailler le maillage interne est alors essentiel, mais comment savoir quelles pages du site il faut mailler en priorité ? Pensez à la méthode N-gramme.

Trouvez facilement un rédacteur professionnel sur Redigeons.com

Contacter nous pour commander des textes

La méthode N-gramme c’est quoi ?

Il s’agit d’une analyse mathématique que l’on va emprunter et utiliser dans le domaine du SEO. Ici, on va l’appliquer au traitement automatique de la langue naturelle (TALN) ou traitement du langage naturel (TLA) puisqu’en référencement naturel, il est surtout question d’analyser des textes.

Un N-gramme définit une séquence d’éléments issus d’un texte. Selon le contexte dans lequel on l’utilise, les éléments en question peuvent être des chiffres, des symboles, des lettres, des mots … Dans notre cas, le N-gramme se réfère à une séquence de N mots que nous utilisons en tant que mots-clés dans nos articles.

Pourquoi s’intéresser aux mots-clés ?

Pourquoi s’intéresser aux mots-clés ?

Pour trouver du contenu (sur un produit ou un service) à travers les moteurs de recherche, les internautes utilisent des mots-clés. Ce sont les requêtes. Si vous avez déjà utilisé un outil générateur de mots-clés, vous avez déjà eu un aperçu des termes les plus utilisés par les internautes. Pour optimiser la rédaction d’un article, nous essayons d’intégrer dans nos articles les mots les plus concurrentiels associés à quelques termes de longue traîne.

A lire – Mot-clé : une base essentielle au SEO

Si, pour la rédaction, cela reste logique, pour le maillage interne, ces listes ne suffisent pas à nous indiquer les structures les plus pertinentes, lesquelles nous permettent de savoir quelles pages nous devons mailler en priorité. Voilà pourquoi il faut entreprendre une analyse N-gramme. Cette dernière va nous permettre de connaître nos N-grammes les plus pertinentes.

Pourquoi trouver ses N-grammes est-il si important ?

Pour découvrir le N-gramme d’un site, l’analyse va s’intéresser à toutes les pages du site. Après analyse, on obtient des séquences de mots-clés qui vont ensuite nous permettre d’analyser les contenus du site et déterminer les pages à fort potentiel. Ces dernières sont celles que l’on doit mailler en priorité. La technique du N-gramme se rapproche un peu du PageRank puisqu’on se base sur le potentiel des pages pour les classer. Dans les faits, la méthode va télécharger les données du site pour les traiter ensuite grâce à un algorithme.

En SEO, les N-grammes se réfèrent aussi sur les probabilités d’apparitions de mots selon les contextes. Comme nous le savons déjà, certains mots sont plus souvent associés que d’autres et Google va s’en servir pour définir la qualité d’un contenu. N’oubliez pas que grâce à l’intelligence artificielle, les robots du moteur de recherche sont désormais capables de comprendre une suite logique de mots. La méthode du N-gramme va vous permettre de faire figurer les mots et suites de mots les plus pertinents dans vos contenus. Le but final : déterminer la pertinence d’une page et faire en sorte que Google la voit sous le même angle que vous.

Comment effectuer une analyse N-gramme ?

Comment effectuer une analyse N-gramme ?

Voici les grandes étapes à suivre pour mener à bien une analyse N-gramme d’un site.

Le téléchargement des données de Google Search Console

Le téléchargement peut se faire sous trois types de formats : CVS, Excel et Google Sheets. Le plus important c’est qu’il se fasse en une seule verticale pour ne pas fausser les résultats.

Un conseil :

Il est mieux d’utiliser l’API Search Console pour pouvoir collecter toutes les données disponibles. En effet, si vous passez par l’interface classique, le nombre d’éléments pouvant être analysé sera limité à 1 000.

En savoir plus sur la Search Console de Google

La suppression des variables non essentielles

Après avoir exporté les données, il va falloir les trier pour ne garder que les variables dont vous avez réellement besoin pour l’analyse. Il faut alors supprimer celles qui ne vous sont d’aucune utilité.

Comment déterminer les variables essentielles de celles qui ne le sont pas ? Tout dépend de la structure que vous souhaitez donner à vos N-grammes. Autrement dit, il va falloir établir une structure précise contenant des variables précis.

Dans l’exemple billet pas cher {{origine}}{{destination}}, vous déterminez à quoi doivent ressembler les résultats qui doivent s’afficher. Ainsi, si vous avez billet pas cher {{paris}}{{marseille}}, vous avez une variable essentielle alors que si vous avez billet {{paris}} pas cher, vous n’avez pas la variable destination donc c’est une variable non-essentielle à retirer de la liste.

Lire aussi – SEO sémantique : tout savoir sur les mots-clés secondaires

Le calcul des N-grammes

Maintenant que vous avez nettoyé votre liste, il faut calculer vos N-grammes. Pour ce faire, il faut utiliser un langage de programmation tel que Perl, Python, Ruby … Python est le plus recommandé, car en plus d’être simple à utiliser, il n’a aucun mal à traiter de grandes quantités de données sur un ordinateur ordinaire.

Pour effectuer le calcul, vous devez :

  • Importer les librairies
  • Créer une liste de mots-clés uniques
  • Compter les mots-clés les plus communs

Le calcul va se faire automatiquement donc il ne vous restera plus qu’à récupérer les volumes de recherche des structures définies. Les résultats s’affichent dans un tableau pour rendre le tri plus simple.

Il faut noter que certains N-grammes sont masqués par la Search Console pourtant ils font de bons mots-clés de longue traîne. Pour les exploiter, vous pouvez utiliser la fonction native d’Oncrawl.

L’extraction des volumes de recherche

Pour cette étape, il va falloir récupérer les volumes de recherche des différentes structures de mots-clés les plus communes pour chaque page du site.

Le but : déterminer les pages qui ont un potentiel de trafic plus élevé, car ce sont elles qui doivent être maillées en priorité. Voilà pourquoi il faut récupérer les volumes de recherche issus de l’activité du site.

A l’issue de cette étape, vous devez obtenir un tableau affichant le volume potentiel par url. Bien évidemment, la somme trouvée doit correspondre au volume des N-grammes les plus courants que vous avez calculés dans l’étape précédente.

La fusion des données

L’obtention du volume potentiel est déjà une grande victoire, mais ne suffit pas pour déterminer les pages à lier en premier. On vous explique pourquoi …

Premièrement, il ne faut pas confondre volume et trafic. Pour cause, il est très bien possible que vous arriviez en première position, mais que votre CTR reste faible.

Deuxièmement, les mots-clés de longue traîne masqués par Google Search Console peuvent avoir du potentiel en fonction de votre secteur. Du coup, les utiliser est conseillé.

Et troisièmement, même si d’une certaine manière, le SEO vise à apporter plus de trafic, ce n’est pas son objectif premier. En effet, il sert surtout à générer des ventes par le biais des moteurs de recherche donc pour que l’analyse N-gramme soit complète, il faudrait faire fusionner les données récoltées grâce aux étapes précédentes avec les données de votre département Ventes. Parmi les données du département à exploiter, on peut citer :

  • Le trafic réel qui se traduit par le nombre de sessions et de clics
  • L’exposition potentielle qui se traduit par le volume et les impressions
  • Les revenus qui se réfèrent au taux de conversion, à la marge et aux revenus

Après fusion, toutes ces données doivent apparaître dans le tableau. Elles doivent vous permettre de déterminer les mots-clés les plus intéressants en fonction de votre activité.

La définition des pondérations

Vous devez maintenant définir des pondérations en fonction des données département pris en compte ci-dessus à savoir le trafic, l’exposition potentielle et les revenus. Vous êtes libre de fixer le pourcentage que vous jugez pertinent en fonction de votre situation. Le chiffre choisi va permettre de classer les différents contenus.

La standardisation

Cette étape permet de redimensionner les données fusionnées plus haut afin de les comparer. L’objectif est ici d’éviter toutes erreurs de calcul.

Il faut effectivement comprendre que d’une vue globale, les impressions resteront supérieures aux sessions et aux clics surtout pour les entreprises à CTR faible. En l’absence de traitement préalable des données, un risque de surpondération des impressions et de sous-pondération des sessions est à craindre.

Voilà pourquoi il faut passer par la standardisation. Le redimensionnement des variables va permettre de les comparer sur une échelle commune.

Le calcul de la note

Après standardisation et puisque vous avez déjà défini une pondération, il faut donner une note à chaque url afin de connaître son importance. Quatre métriques peuvent être adoptées à savoir les volumes, les clics, les sessions et les impressions. Avec cette méthode, vous allez pouvoir faire sortir la meilleure url. Normalement, cette dernière a un volume de recherche faible, mais des impressions élevées et un CTR énorme.

En gros, l’url la plus importante est celle qui affiche le score le plus élevé et ce, malgré un volume de recherche assez faible. Le plus important c’est qu’elle ait suffisamment d’impressions et un CTR élevé.

Même si la méthode N-gramme est complexe, elle permet d’établir un maillage interne plus pertinent et plus complet. La raison est qu’elle ne se base pas uniquement sur le volume de recherche, mais repose sur d’autres éléments plus pertinents. Assurez-vous toutefois d’utiliser toutes les structures, même celles qui ne sont pas prises en compte par Google Search Console. Cela vous permettra d’obtenir des résultats vraiment fiables.

Un dernier conseil :

Pour appliquer correctement la méthode N-gramme, vous devez avoir des connaissances de base en matière de programmation puisque divers protocoles non détaillés dans l’article vont être utilisés. Faire appel à un expert SEO peut être plus sage pour aboutir à des conclusions correctes.