Maintenant que vous connaissez les principes du PageRank, passons à sa formulation mathématique... Nous nous basons sur un article rédigé par les deux fondateurs de Google, même si depuis l'algorithme a dû évoluer : la base reste la même.
Soient A1, A2, ..., An : n pages pointant vers une page B. Notons PR(Ak) le PageRank de la page Ak, N(Ak) le nombre de liens sortants présents sur la page Ak, et d un facteur compris entre 0 et 1, fixé en général à 0,85.
Alors le PageRank de la page B se calcule à partir du PageRank de toutes les pages Ak de la manière suivante :
PR(B) = (1-d) + d x ( PR(A1) / N(A1) + ... + PR(An) / N(An) )
Comme vous pouvez vous en rendre compte, cette formule est à la fois simple et compliquée. Simple parce qu'elle ne dépend que de quelques termes, compliquée parce qu'elle récursive : pour calculer le PageRank d'une page, il faut avoir calculé celui de toutes les pages pointant vers elle. Mais alors comment commencer ?
En fait c'est très simple, il suffit de commencer avec des valeurs arbitraires de PageRank (par exemple 1). Le choix de cette valeur n'a pas d'influence sur le résultat final à condition que toutes les pages commencent avec la même valeur. Une application de la formule permet de calculer un nouveau PageRank pour chaque page, plus proche de la réalité que la valeur par défaut que nous avons choisie au début.
Ensuite nous recommençons à calculer les PageRank de toutes les pages en appliquant de nouveau la formule, mais en partant cette fois des valeurs que nous avons calculées précédemment. Après un certain nombre d'itérations, le système converge : les valeurs de PageRank de chaque page ne bougent plus entre deux itérations.