Grammaire et contenu SEO, La linguistique vous dit ce que vous demande Google !

Encore aujourd’hui, il nous paraît difficile de dire si les mathématiques ou le langage écrit est apparu en premier même si l’on peut dire que les sumériens ont inventé la comptabilité, incidemment l’écriture et peut-être aussi, la première forme de fiscalité (sic). La civilisation sémitique de l’Egypte antique nous rappelle aussi qu’elle fut une des premières sociétés à développer la sémiotique, soit l’étude des signes. La sémiotique déjà élaborée par Sumer va donc logiquement aboutir sur l’arithmétique et l’écriture, le rapport d’un signe au sens. Près de 5 millénaires plus tard, la linguistique évolue et la grammaire viendra fixer les règles orthographiques des langues.

La grammaire (et Google) ordonnent et classifient les éléments du langage

A notre époque, la technologie moderne invente Internet et les moteurs de recherche, dont Google qui, d’une certaine manière, réinvente l’étude des signes même si nous éviterons bêtement de réduire les préceptes de Google à une gestion logarithmique de ses fameux  »mots-clés », autrement dit des sèmes, un signe qui renvoient à un sens. Dites-vous simplement que le constituant premier de la phrase définit précisément ce qu’est la grammaire : grammata en grec, les éléments de base du langage. De là, n’importe quel mot-clé représente précisément un élément premier à manipuler au coeur de vos textes, un élément purement grammatical en soit, simple ou composé. Google n’a donc rien apporté à la grammaire ni à la linguistique mais il les exploite à sa manière et sait à peu près comment s’en servir d’un point de vue basique. Cela implique aussi que vous sachiez les manipuler, c’est le job des rédacteurs SEO.

Si la grammaire est une étude des éléments de la phrase, dans quelle mesure la question du sens est-elle définissable pour Google ?

Disons que l’objectif de cet article sera précisément de vous sensibiliser à la question du sens et de son rapport au signe, de vous parler de sémiotique et de savoir si Google y comprend quelque chose ainsi que de vous sensibiliser à quelques définitions formelles de la linguistique qui pourront vous donner quelques outils utiles d’écriture.

Quant à parler de grammaire, la majorité des rédacteurs SEO sont parfaitement conscients de la nécessité de maîtriser leur langue maternelle dont l’orthographe, la syntaxe et les quelques subtilités du français. Dans le même temps, Google nous aura, semble t-il, habitué à un vocabulaire quelques-peu différent de celui que nous employons régulièrement pour laisser apparaître des étrangetés du genre  »mots-clés »,  »algorithmes »,  »pénalités » qui nous semblent, a priori, assez éloignés du monde originel de la linguistique. Actuellement, l’expression la plus inepte qui circule sur le Web s’articule en termes de  »Méta-mots », une nouveauté terminologique particulièrement ridicule et dénuée de sens qui trahit surtout l’ignorance des règles grammaticales du français par son auteur. Rassurez-vous, Ferdinand Saussure n’est pas prêt de s’en retourner dans sa tombe (il dort toujours très paisiblement) même si la manière dont les moteurs de recherche travaillent – et Google le premier – ont beaucoup empruntés au monde des linguistes. Cet article n’a pas pour autant l’objectif de déclarer une guerre ouverte entre les gardiens de la langue et Google mais plutôt, de rendre à César ce qui est à César, afin de faire la lumière sur ce que le  »pseudo-monstre du Web » nous a emprunté, sans nous en demander la permission, ni même le savoir !

Naturellement, les quelques informations sémantiques et syntaxiques dont je vais vous faire part vous permettront aussi de comprendre comment un moteur de recherche fonctionne, en partie à cause des emprunts (hasardeux ou conscients) qu’il a fait à la linguistique moderne.

Ce que nous dit le langage, ce que nous dit Google…

La linguistique, c’est l’étude du langage, tout simplement. Et si je vous ai cité Saussure, c’est qu’il s’agit sans doute d’un des linguistes les plus connus de cette science humaine trop méconnue du grand public, et encore bien plus des informaticiens ou diplômés en communication et IT qui doivent, bien malgré eux, essayer de comprendre ce que la linguistique primaire de Google veut bien leur dire. Bref… commençons par le commencement, sans trop nous attarder sur les détails.

Ce que nous dit la linguistique, c’est que toute langue, quoi qu’elle soit ou qu’elle fut, comporte deux entités et seulement deux entités : le Sujet et ce qu’on en dit. Que vous étudiez le chinois, le français ou le javanais, la communication par le langage s’arrête à ces deux entités. Pour Google, cela s’arrête d’abord à un ensemble de termes, les moteurs de recherche ne font pas – pour l’instant – de différences entre un substantif, un verbe, un adverbe ou un adjectif ; les parties du discours (classables parmi ces deux entités) n’intéressent pas les machines ni les algorithmes qui les font fonctionner. Google travaille certainement avec les grammata du langage mais pas encore avec l’articulation des langues (ce qu’on appelle les syntagmes). L’articulation langagière des moteurs de recherche en restent donc au niveau basique des Meta-mots ou Meta-words en anglais mais jamais au niveau de la phrase, qu’ils ne comprennent pas mais interprètent comme un ensemble de paradigmes.

Paradigmes, syntagme nominal (SN) et verbal (SV)

Bref, histoire de revenir aux êtres humaines derrière la machine, précisons quelques notions élémentaires de linguistique… Tout d’abord, une langue est composée de deux syntagmes (ou groupes sémantiques) qui font référence au champ du sujet et à celui du verbe : le Syntagme Nominal/Sujet et le Syntagme Verbal, ou SN + SV. Quoi que vous puissiez dire et quel que soit la langue que vous utilisiez, cette règle s’applique. Prenez la phrase : La chien de mon oncle a mangé le goûter de mon petit frère, rien n’est alors plus facile de découper la phrase en SN : Le chien de mon oncle et le SV : a mangé le goûter de mon petit frère. Vous pouvez donc faire ceci avec n’importe quelle phrase, quelle que soit la complexité de vos phrases, le principe est toujours le même : {qui parle et que dit-il ?} ou {qu’est-ce que c’est et ça sert ou ça fait quoi ?} (phrases simples, complexes avec relatives, conjonctives… répondent toujours au même principe). Cette règle élémentaire du langage (SN + SV, aussi nommée axe syntagmatique) qui sépare le champ du Sujet et le champ du Verbe est en étroite relation avec les éléments de la phrase, ce que l’on appelle des paradigmes au sens le plus large, lexèmes et lèmmes au sens plus étroit de la linguistique ; j’y reviens.

Lexèmes, lemmes, terminologie, lexicologie

Pour en revenir à quelques termes de linguistique très connus, essayons simplement d’en retirer l’essentiel en soulignant le rapport entre le signe et le sens, là où les algorithmes de Google n’ont pas encore accès, un moteur de recherche ne faisant pour l’instant, que du classement, un peu à la manière de la taxinomie mais en y associant plusieurs termes (ce que certains jeunes premiers appellent des méta-mots alors qu’en grammaire, on appellerait cela des termes apposés puisqu’ils ne représentent pas une phrase).

Disons simplement que les moteurs de recherche travaillent par associations de termes avec ce que l’on appelle des lemmes et des lexèmes ou unité lexicales, un terme qui associe une unité de sens à une unité de son. Ainsi achat, achète et acheter sont trois formes du lexème ach-, radical qui donne le sens des trois paradigmes précités. On remarquera aussi que la plupart des articles traitant des résultats donnés par les moteurs de recherche parlent effectivement des lexèmes et des lemmes, sans même le savoir. De même, on pourra dès lors définir les lemmes qui sont les formes composées d’un lexème. Dans notre exemple, achat et acheter sont deux lemmes du lexème ach-, tous deux sont considérés comme autonomes sur le plan sémantique. In fine, un mot (ou un paradigme dans un sens plus général) est forcément composé d’un lexème alors qu’il est un lemme lorsqu’il est prononcé puisqu’il fait sens. Quant à nos fameux moteurs de recherche, nous savons dès lors qu’il est possible d’isoler un lexème pour en déduire l’ensemble des lemmes et se constituer dès lors une terminologie restreinte ou plus complexe, en fonction du nombre de lemmes à associer entre eux.

En effet, il est ensuite possible de partir de plusieurs lexèmes pour en retrouver à chaque fois les lemmes et constituer un ensemble de termes apposés ou  »méta-mots » pour en revenir à nos petits génies de la communication, un domaine de la pensée toujours aussi ridicule, même dans le monde de Google. Voilà cependant de quoi vous constituer une terminologie complexe, basée autant sur les termes eux-mêmes que sur leurs combinaisons. De là, rien de plus simple que de soumettre  »achat immobilier Quimper » ou  »acheter bien immobilier région Quimper » etc. Évidemment, ces combinaisons ne pourront venir que de vous-même puisque vous êtes le seul à pouvoir leur donner le sens qu’il convient, en fonction de telle ou telle recherche.

L’axe paradigmatique et l’axe syntagmatique

Terminons cependant cet article par une étude de sens de la phrase, je vous ai d’ailleurs bassiné quelques-peu avec la notion de paradigme, il faut y revenir. En réalité, on comprendra que le sens d’une phrase émerge d’un monde qui n’a pas de sens en lui-même puisque d’un point de vue global, une phrase est nécessairement porteuse de sens (par opposition aux paradigmes placés sur les moteurs de recherche) mais qu’elle est constituée d’éléments qui n’ont pas de sens lorsqu’ils sont isolés de manière autonymique. Cette curieuse bizarrerie du langage qui ne porte sens qu’à travers l’association de ses propres termes (eux-mêmes préalablement définis) s’explique en admettant qu’une phrase est construite sur deux niveaux, un niveau vertical appelé axe paradigmatique et un niveau horizontal, celui des syntagmes (SN + SV) dont nous avions déjà discuté. Il s’agit de l’axe syntagmatique, lequel dépend d’une syntaxe qui elle-même donnera du sens à vos phrases. Je m’explique…

Si vous prenez plusieurs paradigmes : chaussure, table, banane, vélo, dictionnaire… et que vous les insérez dans une phrase telle que celle-ci :  »produit une marge de 15% net ». Au final, vous avez :

chaussure –

table –

banane – produit une marge de 15% net.

vélo –

dictionnaire…

Ces phrases où chaque paradigme est associé à la phrase donnée ne produit pas nécessairement de sens mais le problème n’est pas là. En réalité, le bon paradigme produira du sens à partir du moment où celui-ci sera contextualisé. Dans ce cas, ajoutez-y le bon déterminant  »la », pour former la phrase  »la chaussure produit une marge de 15% net’‘, celle-ci aura alors sans doute du sens pour un vendeur de chaussures. A partir de là, vous pouvez imaginer des centaines de paradigmes différents sous toutes les formes possibles (nom commun, adjectif, verbe, pronom…) pour former la totalité des phrases (porteuses de sens ou non) qui pourront un jour être prononcées. L’ensemble des paradigmes constituent donc un groupe de termes qui s’insèrent dans la direction verticale du langage appelé axe paradigmatique.

Avec cet axe, le second axe du langage (l’axe syntagmatique) détermine quant à lui le sens de vos phrases par associations des syntagmes nominaux et verbaux en fonction de la syntaxe particulière d’une langue. A partir de cet exemple très banal de la linguistique, vous comprendrez donc encore mieux que d’associer des paradigmes entre eux dans l’espace de votre moteur de recherche ne constitueront jamais vraiment de sens en eux-même mais que les résultats qu’il vous donneront pourront varier en fonction de l’ordre de ces mêmes paradigmes puisque le concept de  »phrase » est encore difficilement compréhensible pour un moteur de recherche.

Tous les lemmes ne sont pas des lexèmes mais ils font partie de la sémantique du langage

En effet, les lemmes qui ne sont pas des lexèmes (mots de liaison comme les coordinations  »et »,  »de »…) ne sont pas pris en compte par les robots puisqu’ils n’ont pas de sens précis en termes de recherche. Et pourtant, ce sont eux qui donnent du sens à vos phrases. Dans ce cadre, Google travaille toujours par associations restrictives et isolation des termes et non pas sur des critères sémantiques. Par exemple  »acheter puzzle 1500 pièces », tout le monde comprendra les termes apposés constituant un sens précis sauf Google mais ce n’est pas important. Vous, en tant qu’internaute, vous ne notez que les termes qui font sens pour vous et qui par associations, vous donnent un résultat en termes de sites à consulter, eux-mêmes basés sur des associations de paradigmes (sites + vente + jeu de société + puzzle + 1500 pièces). Vous voulez précisément acheter un puzzle de 1500 pièces, votre raisonnement va donc incidemment dépendre de la syntaxe du français, raison pour laquelle vous avez soumis cette requête dans cet ordre. On peut donc en déduire qu’une syntaxe préférentielle apparaîtra naturellement dans les moteurs de recherche mais celle-ci est de l’ordre de l’humain, pas de celui du robot. Ainsi, en testant des ordres différents, vous pourriez en déduire des résultats différents (ou non), en fonction du travail des robots mais en aucun cas, Google n’est capable de comprendre ce que vous lui demandez.

Pour terminer cet article un peu long mais nécessaire, disons tout simplement que si vous aimez les  »méta-mots », il vous suffit peut-être de réfléchir en termes de linguiste, cela vous évitera déjà de passer un temps fou à vous demander si tout ceci à du sens puisqu’il n’y en a pas pour Google, mais tout simplement d’utiliser les outils grammaticaux qui sont à votre disposition depuis plus de trois siècles pour que Google vous amène aux résultats que vous souhaitez voir apparaître sur son moteur de recherche.

Merci Ferdinand 🙂

Note: Bien sûr, il ne s’agit pas de confondre le lemme des mathématiques et le lemme linguistique.