Ceci est une ancienne révision du document !
La notion de pagerank a fait apparition suite à la création de la société google (nom basé sur le nombre gogole, qui est égale à 10100, une référence au nombre de millions de pages indexés par le navigateur, qui a notre heure, est égale à 1012 pages.)
Ainsi chaque pages indexés peut être retrouvé grâce aux mots clés et à l'algorithme de Google lors des requête de recherche. Par exemple lors de la recherche d'un nom d'une popularité, nous retrouvons tous les résultats sur cette personne et non sur une autre personne ayant le même nom.
Nous retrouvons cette technologie inventé par Larry Page dans un célèbre navigateur: Google. Il a une place importante dans le résultat des recherches réalisés sur le navigateur, il permet en quelque sorte d'évaluer l'importance d'une page d'un site sur une échelle de 0 à 10 représentant sa valeur / son score. Ainsi lors d'une recherche, le PR sera un facteur du résultat obtenu.
Cet indicateur, le Pagerank aussi appelé PR en est un parmi d'autre dans l'algorithme de Google permettant un résultat pertinent, à savoir que celle ci est recalculé en moyenne 4 fois par ans lors du célèbre “ Google Dance”. Voici une courte liste des 200 différents facteurs permettant l'affichage d'un résultat lors d'une recherche Google:
L’Age du domaine | Présence d’un fichier robots.txt | Pas de contenu dupliqué |
Exact Match Domain | Nombre liens sortants | Usage d’images |
Mots Clés | Conformité W3C 1) | Contenu tout public |
Historique du domaine | IP Géolocalisée | Crédit des photos |
Whois non anonyme | Déclaration Google Webmaster Tools | Avis clients certifiés |
Extension adaptée | Google Analytics | Mots clés dans la balise h1 |
Pas de frame | Langues séparées | Formulaires avec politique de confidentialité |
Peu de flash | Balise alt des images | Zéro malware |
Pages accessibles par des liens | Balises titre différentes | Conditions Générales de Vente |
Sitemap du site | Meta descriptions différentes | Numéro de téléphone |
Contenus lisibles par les robots | Orthographe | Version mobile |
Et pleins d'autres … |
Le système de Pagerank fonctionne en quelque sorte comme les élections, on retrouve un électeur et un candidat (Toutes pages est à la fois un électeur et un candidat). Plus le candidat a de votes, plus il a un PR élevé, cependant ce n'est pas totalement semblables aux élections, nous retrouvons certaines spécificité à l'algorithme:
L'électeur peut voter pour plusieurs candidats mais son vote sera moindre et donc divisé en fonction du nombre de votes.
Et inversement plus le candidats reçoit de vote, plus son vote à son tour sera important,
Nous pouvons donc modéliser cette relation de récurrence par une formule: Avec Pi représentant les pages pointant vers P dont:
Cependant Google cherche à modéliser la probabilité de l'internaute allant d'une page A à une page B, il aura bien sûr une plus grande probabilité d'être sur la page B si la page A a peu de liens sortant. A savoir que Google cherche aussi à modéliser la probabilité de l'internaute à aller d'une page A à la page C en passant par la page B. Pour cela ce facteur est pris en compte dans le calcul grâce à un facteur d'atténuation d, qui est approximativement égal à 0,85. A savoir que la somme des PR de chaque page du site est égal au nombre de pages.
Il existe plusieurs moyens de calculer le Pagerank d'une page:
Grâce à différents outils disponible sur internet, nous pouvons donc facilement connaître le pagerank d'une page, le premier, la Google ToolBar permettait de la connaître directement à partir du navigateur le PR de la page, s'en est suivi depuis sa suppression en Mars 2016 de nombreux outils disponible en ligne, tel que:
Le second étant une calculatrice en ligne, permettant de calculer le PR en fonction des informations rentrés.
Le dernier moyen à ma connaissance est par le calcul, grâce à la formule de récurrence présenté ci dessus, voici un exemple: