martedì 18 settembre 2007

Come si calcola il Page Rank

Il Page Rank è una misura della popolarità di una pagina web. Più una pagina è linkata dalle altre pagine, più alto sarà il suo Page Rank.

Quello che ci interessa sapere è quanto valore del Page Rank ci passa una pagina che ci linka. Per avere questa informazione, dobbiamo disporre di due informazioni: il valore reale del Page Rank e il numero totale dei link nella pagina.

Il valore del Page Rank conosciuto a tutti è quello che si può leggere dalla Toolbar di Google e che varia tra 0 e 10. Questo valore è la rappresentazione logaritmica del valore reale ed è sempre arrotondata in difetto.

Secondo la formula per il calcolo del Page Rank, il valore reale che passa un pagina (chiamiamola pagina A) ad una pagina che linka (chiamiamola pagina X) è:

PR[Xa] = d * ( PR[A] / C[A])

Detto con le parole: il Page Rank che riceve la pagina X dalla pagina A (PR[Xa]) si ottiene dividendo il Page Rank reale della pagina A (PR[A]) per il numero totale dei link che si trovano sulla stessa pagina A (C[A]) (complessivo dai link interni e quelli esterni), moltiplicato per un fattore di smorzamento (d) che presumo abbia un valore pari a 0,75 (è un valore deciso da Google, non conosciuto, ma cambia poco il discorse se il valore presunto in questo articolo non sia quello esatto).

Il valor complessivo della pagina X e la somma di tutti i “contributi” che la pagina riceve dalle varie pagine che la linkano. Assumendo che la pagina X è linkata dalle pagina A, B, C e D, il suo Page Rank reale (PR[X]) sarà:

PR[X] = PR[Xa] + PR[Xb] + PR[Xc] + PR[Xd]

Si presume, ancora, che la scala logaritmica sul Toolbar è sulla base 7.

Basandosi su questi esposto e presunto, si può calcolare la tabella dei valori reali del Page Rank che una pagina (A) con un certo Page Rank letto dal Toolbar passa ad un’altra pagina che linka (X), supponendo che tale pagina (A) linka soltanto una pagina sola, cioè la pagina X.


Toolbar Valore Valore
PR Minimo Massimo
0 1 4
1 5 36
2 37 256
3 257 1.800
4 1.801 12.604
5 12.605 88.236
6 88.237 617.656


Attenzione: questi non sono valori reali del Page Rank, ma valori reali del Page Rank che passa una pagina con un link solo, alla pagina linkata.

I valori minimi sono ottenuti alzando il numero 7 (base del logaritmo) sulla PR potenza e moltiplicando per 0,75 (il valore di smorzamento), per esempio: il valore minimo per il Toolbar Page Rank 5 è (7^5)*0,75 = 12.605.

I valori massimi sono semplicemente quelli minimi del ToolBar Page Rank superiore, diminuiti di 1, per esempio: il valore massimo per il Toolbar Page Rank 5 è 88.237-1 = 88.236.

Adesso, per sapere quanto valore ci passa una pagina, dobbiamo prendere il valore reale passato (dalla tabella) e dividerlo per il numero totale dei link presenti nella pagina che ci linka. Qui si trova un problema: quale valore prendere? Quello minimo o quello massimo, oppure una media?

E’ impossibile risolvere questo problema in quanto dai dati che ci fornisce Goole e possibile calcolare soltanto un intervallo, non il valore preciso del Page Rank reale. Io personalmente mi baso sempre sul valore minimo, stando così largamente a favore di sicurezza.

Un altro problema che bisogna affrontare e come trovare il numero dei link sulla pagina che esaminiamo. Ci sono alcuni siti web dove si trovano gli strumenti che danno anche questa informazione.

Alla fine di tutti i calcoli, sommando il Page Rank che ci passano tutte le pagine che ci linkano, arriviamo ad un valore reale del Page Rank della nostra pagina. Supponiamo che questo valore è pari a 780. Per calcolare il Page Rank del Toolbar occorre calcolare il logaritmo di questo numero sulla base 7. Visto che quella funzione (log. sulla base 7) non è presente nelle abituali calcolatrici, si può procedere utilizzando il logaritmo sulla base 10 e si ottiene: log(780) / log(7) = 3,4. Visto l’arrotondamento in difetto, il Page Rank sulla ToolBar sarà 3.