Étant donné qu’il s’agit d’un site doté d’un outil génial pour visualiser un site Web (comme le ferait un moteur de recherche), il semblait normal que nous allions plus loin. Beaucoup dans le monde de l’optimisation de la recherche croient qu’ils « l’obtiennent », mais on ne peut pas être trop sûr.
La plupart du temps, nous entendons parler de choses comme les éléments ‘liens’, ‘balises méta’ ‘titre’. Mais c’est vraiment une vue limitée de ce que les moteurs de recherche (comme le tout-puissant Googly) font lorsqu’ils évaluent votre site. Je pensais que ce serait un exercice intéressant de marcher un peu plus profondément dans les bois.
Marchez avec moi….
Pages v Sites Web
L’une des premières choses que nous devons comprendre est qu’il existe en effet des éléments qui diffèrent entre une page et l’ensemble du domaine. Celui-ci est intéressant dans la mesure où j’ai souvent l’impression que les SEO ne le comprennent pas toujours. En fait, la plupart des choses qu’un moteur de recherche fait se font au niveau de la page, pas au niveau du domaine.
En fait, en dehors des liens, les seuls domaines vraiment importants qui ont tendance à être à l’échelle du site sont les éléments de confiance, les classifications (topiques, etc.), les ratios de liens internes et les éléments géo-localisés. En gros, un moteur de recherche voit réellement votre site page par page. C’est la première distinction importante à garder à l’esprit.
Signaux au niveau du site
Mais que voit Google au niveau du site?
Autorité / confiance; c’est le concept global non seulement de ce que vous faites sur votre site (liens sortants, spam Web, redirections sournoises, contenu mince, etc.) mais de ce qui se passe hors site (spam de lien, spam social, etc.). Quel niveau de confiance votre site web a-t-il aux yeux du moteur de recherche? C’est quelque chose d’incroyable difficile à construire, mais facile à perdre.
Contenu mince (officiellement connu sous le nom de Panda); bien que lié à ce qui précède, il vaut la peine d’avoir seul. De grandes quantités de contenu mince et / ou de dulpication pourraient se retrouver dans l’amortissement de sections ou de sites entiers. Nous pouvons également considérer les conepts GooPLA (Algorithme de mise en page Google) ici aussi.
Classifications; bien que cela existe généralement plus au niveau de la page, il existe des éléments catégoriels pour l’ensemble d’un site Web. Ceux-ci peuvent également contenir des éléments plus granulaires. D’un site de commerce électronique (ou d’un sous-domaine, etc.) à un marché donné. C’est là que l’architecture forte peut devenir votre meilleur ami. Aidez le moteur de recherche à comprendre (et à classer) en quoi consiste votre site et ses différentes parties.
Rapports de liaison internes; en termes simples, vous souhaitez montrer à un moteur de recherche l’importance des pages via des liens internes. Lien vers les pages les plus importantes le plus, le moins important le moins. Cela peut souvent entraîner des problèmes de mappage de page (mauvais classement des pages cibles).
Localisation; un autre élément de nature plus large est la localisation. Signification; le cas échéant, où réside cette entité? Quels domaines desservent-ils? Nous pouvons même envisager des cibles géographiques pour des sites qui ne sont pas directement liés à la géolocalisation. Les éléments ici peuvent inclure le domaine de premier niveau, la langue, etc.
Entités; une entité est une personne, un lieu ou une chose. Il ne faut pas chercher plus loin que le graphique de connaissances de Google pour voir l’importance qu’ils accordent apparemment à ceux-ci au fil des ans. S’il s’agit de marques sur la page (commerce électronique) ou de citations dans un document d’information, rendez-les visibles. En outre, Google semble optimiste sur la paternité ces derniers temps, alors considérez également les entités de l’entreprise (personnes) et comment elles peuvent être exploitées. Votre site peut « être » une entité ainsi que des sous-entités et des associations tout au long.
Historique du domaine; Matt Cutts a récemment parlé de la façon dont un domaine qui a VRAIMENT eu des problèmes pourrait même entraîner des pénalités après que quelqu’un d’autre l’ait acheté. Étant donné que, nous savons dans une certaine mesure que Google peut potentiellement examiner l’historique des domaines lors de la classification d’un site Web. Cela joue bien sûr dans les éléments de « confiance » ci-dessus.
Signaux de niveau de page
Comme je l’ai mentionné précédemment, Google (et la plupart des moteurs de recherche) regardent souvent les choses page par page, pas à l’échelle du site. C’est une distinction importante que les types de référencement semblent souvent oublier. Ils parcourent LES PAGES.
Quels éléments un moteur de recherche peut-il examiner au niveau de la page ?
Méta-données; la plus simple ici est bien sûr les données d’en-tête du TITRE aux Méta-descriptions (pas un facteur de classement) et même les balises canoniques et autres. Certains de ces éléments peuvent être des facteurs de classement tandis que d’autres (rel = canonical par exemple) peuvent indiquer à Google comment traiter la page.
Classifications (et localisation); tout comme les pages des éléments au niveau du site elles-mêmes tomberont sous le coup de classifications. Il peut s’agir d’un type de contenu (informationnel, transactionnel, etc.), d’une intention (commerciale, connaissance), d’une localisation (sur une région donnée), etc. Assurez-vous de communiquer l’intention et les éléments de base d’une page donnée.
Entités; Encore une fois, comme au niveau du site, des entités peuvent également être associées à une page donnée sur le site. En fait, Google envisage potentiellement désormais d’associer une inférence de requête (symptômes médicaux) et une entité (la condition elle-même).
Autorité/confiance (liens externes); au-delà des éléments de paternité mentionnés ci-dessus, les signaux de confiance peuvent également être vus dans ce que vous liez (ainsi que les citations). Cela peut être positif ou négatif. Profitez de l’occasion où vous le pouvez pour associer la page à d’autres identités Web faisant autorité.
Signaux temporels; au niveau de la page, Google examine potentiellement des éléments tels que; Création / âge du document, fraîcheur, (QDF et al), tendances de niche, taux de mise à jour du contenu et plus encore. Ils peuvent même regarder la requête historique et cliquer sur les données.
Signaux sémantiques; les pages web ont des mots non? Les moteurs de recherche aiment les mots, oui? Assurez-vous ensuite qu’une certaine forme d’analyse sémantique est en cours pour la page, y compris la catégorisation du contenu, les ratios terme / phrase associés, les citations et plus encore.
Indicateurs linguistiques (langue et nuances); bien sûr, dans le cadre des méthodes de classification ci-dessus, la page peut également aider à une identification démographique plus étroite grâce à la langue de la page.
Facteurs de proéminence; un autre domaine qui ne reçoit pas beaucoup d’attention mais qui est connu pour apparaître au fil des ans dans divers brevets sont des éléments tels que;titres (h1-h5), gras, listes (et éventuellement italique). Ils ne pèsent probablement pas lourd, mais valent en effet la peine d’être pris en compte.
Oh et je ne plaisante pas quand je dis qu’il y en a plus. Nous nous en tenons à certaines des parties de niveau supérieur pour faire passer le message. Nous avons probablement déjà perdu ½ des lecteurs qui ont commencé cette pièce. Merci d’être resté.
Les choses hors site
Alors que l’objectif de cette offre était plus sur les bits sur site, Google voit également les activités hors site dans le cadre de sa perception. De l’autorité et de l’actualité aux données démographiques et aux catégorisations, cela entre en jeu dans la mesure où Google vous perçoit comme une entité / un ensemble d’entités.
Ceux-ci peuvent inclure….
Facteurs liés au lien;
- PageRank (ou évaluation du lien nodal relatif)
- Texte du lien (interne et externe)
- Pertinence du lien (global et page)
- Également; Analyse temporelle, PageRank personnalisée et sémantique
Temporelle;
- Vitesse du lien
- Âge du lien
- Fréquence de citation de l’entité
- visibilité sociale
Autorité / Confiance;
- Citations
- Co-citations
- Signaux de type TrustRank
Reach;
- Liens
- Actualités
- Social
- Vidéo
Vous avez l’idée. Je ne veux pas vraiment me concentrer autant sur les éléments hors site aujourd’hui. Nous les examinons car ils tombent dans « comment Google voit votre site Web ». Ce n’est tout simplement pas l’objectif…
Se déplaçant…
La connexion Spam
Un autre élément vaguement lié à la façon dont Google perçoit le site est bien sûr; la récupération d’informations contradictoire. Mieux connu sous le nom de recherche et destruction pour le spam Web. Bien que la compréhension des facteurs de classement soit une excellente idée, il est également bon de savoir des choses qui pourraient également être atténuées.
Le spam Web se divise généralement en deux catégories;
- Boosting; tactiques utilisées pour augmenter un classement (lien spam par exemple)
- Masquage; tactiques utilisées pour induire en erreur ou tromper le moteur de recherche (dissimulation par exemple)
Encore une fois, ce n’est pas l’objectif principal, alors assurez-vous de lire mon article sur le spam Web pour en savoir plus. Certains éléments courants de lutte contre le spam incluent;
Contenu Spam
- Langue:
- Domaine:
- Mots par page:
- Mots-clés dans le TITRE de la page:
- Quantité de texte d’ancrage:
- Fraction du contenu visible:
- Compressibilité:
- Mots globalement populaires :
- Spam de requête:
- Spam au niveau de l’hôte
- Basé sur des phrases
Spam de liens
- TrustRank:
- Bourrage de liens:
- Liens népotistes:
- Spam topologique (fermes de liens):
- Anomalies temporelles:
Nous sommes tous maintenant assez familiers avec les dévaluations Panda (type) et Penguin ainsi que les actions manuelles telles que les messages de liens non naturels. Mais il faut également être conscient de la myriade d’autres façons dont Google pourrait regarder votre site, en termes de spam.
SEO est mort
Non? Ok, peut-être pas.
Votre mission mes amis, si vous choisissez de l’accepter, est de développer une stratégie de référencement qui couvre tous les éléments de ce post. Parce que c’est mon ami, c’est ce que l’optimiseur de recherche averti devrait faire.
Je pourrais m’asseoir ici et vous expliquer comment les exploiter tous, mais c’est un article et non un livre.
Mon objectif ici aujourd’hui était de mettre en lumière la complexité de notre réalité. Si vous êtes un propriétaire de site Web, un passionné de référencement ou un gourou de l’optimisation du noyau dur. Ne devenez jamais myope sur le fonctionnement réel de Google. Voir la forêt, voir les arbres et même les feuilles.
Comme vous l’étiez…..
Images de David Harry