Une présence robuste et construite avec soin sur Twitter peut aider de manière significative votre visibilité dans la recherche sémantique. Explications claires et conseils experts du grand spécialiste David Amerland.

Par

Lorsqu’on parle de recherche sémantique, l’une des premières questions qui se pose est de savoir si une forte présence sur les réseaux sociaux influence votre ranking. Bien que la réponse intuitive soit “oui bien sûr, les signaux sociaux devraient jouer un rôle”, certaines considérations pratiques rendent cela compliqué. Matt Cutts de Google l’a expliqué dans la courte vidéo datée de janvier 2014 ci-dessous.

Les explications de Matt reprennent ce que les représentants de Google ont répété de manière régulière aux conférences auxquelles j’ai assisté : les signaux sociaux sont faibles ou sales parce que Google n’a pas suffisamment accès à l’intention du post qu’il crawle ou ne peut pas réellement se faire une idée de son contenu.

Matt parle par ailleurs de la capacité de la recherche sémantique à extraire l’identité d’une personne à partir de ses profils sociaux, même lorsqu’aucun nom réel ou aucune autre information n’est mentionnée.

Même si les signaux sociaux faibles ou autres ne sont pas un facteur de ranking, cela ne signifie pas qu’ils n’ont pas d’impact sur la recherche et qu’ils n’aident pas à améliorer la visibilité des profils personnels et des sites qui leur sont associés.

Une façon d’y parvenir pour Google consiste à appliquer des algorithmes opérant via la supervision pas-trop-lointaine (not-so-distant supervision).

Pour mémoire, l’indexation de tweets non supervisés conduit à l’accumulation d’erreurs qui déprécient l’indexation. L’indexation supervisée, c’est à dire celle par laquelle des testeurs humains collectent activement et taguent le corpus indexé n’est pas non plus sans poser de problèmes car des hypothèses erronées, des erreurs humaines et même des tags positifs incorrects peuvent entraîner une diminution de la précision.

L’approche proposée par Google consistant à adapter les tags au moyen d’une supervision pas trop lointaine (not-so-distant supervision) est une approche hybride qui semble résoudre la plupart des problèmes liés à la bonne compréhension du sens d’un tweet et de son importance en relation à ce qui se passe sur le web. Un tag est une métadonnée qui permet à un robot indexateur de labelliser correctement un tweet de façon à l’intégrer à l’index sémantique de Google.

Comme le disent les chercheurs de Google eux-même, c’est loin d’être facile… : “Les défis sont nombreux, depuis le traitement des variations orthographiques jusqu’aux conventions liées aux commentaires et aux retweets, en passant par l’utilisation fréquente d’abréviations et d’emoticons, la syntaxe non-standard, le langage fragmenté ou mixte, etc.” Il faut ajouter à tout cela le fait que la contrainte de 140 caractères crée une nature homogène qui rend plus difficile la distinction entre un tweet et un autre en termes de structure... Vous voyez l’ampleur du défi.

Comment la recherche sémantique indexe les tweets

Google peut contourner tous ces problèmes grâce à la puissance de traitement de ses ordinateurs afin de réaliser les tâches suivantes :

  • Analyse d’un tweet en relation à des requêtes (search queries) similaires
  • Analyse d’un tweet en relation à l’accélération du contenu sur le web
  • Analyse d’un tweet en relation au contenu lexical trouvé sur le(s) site(s) vers lesquels pointe le tweet
  • Analyse du site web vers lequel pointe un tweet
  • Corrélation des requêtes et de snippets fournis par le moteur de recherche avec la même structure lexicale que le tweet
  • Détermination des taux de clic (click-through-rate, CTR) sur des requêtes spécifiques comme guide qualitatif pour créer une bibliothèque de tags qui peuvent être appliqués à l’indexation de tweets
  • Extraction d’entités dans les tweets et mise en correspondance avec des entités connues déjà indexées
  • Analyse du tweet en relation à d’autres tweets de nature similaire ou directement tangentielle populaires sur Twitter.

En d’autres termes, c’est un peu sorcier.

Que devons-nous faire ?

Si vous souhaitez utiliser votre présence sur Twitter pour améliorer votre visibilité en termes de recherche sémantique, voici ce que vous devriez faire :

  • Lorsque vous tweetez, intégrez un lien vers votre site (ou vers un site pertinent avec le contenu de votre tweet)
  • Assurez-vous qu’au moins 20% de vos tweets contiennent une URL pointant vers une page spécifique de votre site web
  • Assurez-vous que la page vers laquelle renvoie votre tweet contient suffisamment d’information pour permettre à Google de déterminer précisément l’intention de votre tweet
  • Utilisez dans votre tweet un langage reflété dans le contenu de l’URL vers lequel vous pointez
  • Puisque les tweets peuvent être indexés sémantiquement, Twitter est désormais plus lié que jamais à la recherche sémantique. Tweetez des snippets qui pourrait apparaître dans les résultats de recherches
  • Formulez votre tweet en tenant compte de requêtes potentielles
  • Évitez l’emploi d’une syntaxe inhabituelle ou difficile à comprendre
  • Créez une autorité de domaine (domain authority) dans votre compte Twitter en chargeant vos tweets de contenu spécifique à celui-ci
  • Assurez-vous que votre tweet et votre page comportent au moins un mot en commun qui ne soit pas un mot bloquant
  • Ne faites pas de lien vers votre page d’accueil, Google le décompte toujours dans son indexation.

Conclusion

Même si les signaux sociaux ne sont pas directement un signal aidant au ranking, un fort signal social aide Google à établir une certaine confiance dans son indexation des sites web qui conduit ensuite à une meilleure visibilité dans la recherche. Son indexation permet également d’identifier ce que fait le site, ce qui aide Google à mieux comprendre sa différence avec les autres sites et conduit à des résultats de recherche plus précis et plus en adéquation avec le contenu de votre site.

Une présence robuste et construite avec soin sur Twitter peut aider de manière significative votre visibilité dans la recherche sémantique en permettant de définir la pertinence de votre site web.


Intéressé par le sémantique ? Sur la Cascade, retrouvez d’autres articles.


Ressources complémentaires en français

Qu’est-ce que la recherche sémantique ? par David Amerland
Introduction à RDFa, par Mark Birbeck
À propos des microdonnées, par Google

Ressources complémentaires en anglais

Adapting taggers to Twitter with not-so-distant supervision, par Google Research
Simple and Knowledge-intensive Generative Model for Named Entity Recognition, par Microsoft Research
SEO Authority Tools, par SEO Review Tools
5 Practical Steps To Improving Your Website’s Domain Authority, par Neil Patel
What Is a “Good Link Profile” and How Do You Get One? par Neil Patel


original paru en dans le blog de David Amerland.

Sur l’auteur : est spécialiste du web sémantique et de la recherche sémantique. Il donne de nombreuses conférences dans le monde entier et est l’auteur d’ouvrages spécialisés, dont Google Semantic Search. On peut le suivre sur Google+ et sur Twitter.

Traduit avec l’aimable autorisation de l’auteur.
Copyright David Amerland © 2014.